FoolNLTK 釋出 Java 版,基於深度學習的中文文字處理工具

類別: IT
標籤: java

FoolNLTK 是一款基於深度學習的中文文字處理工具,暫時包含分詞,詞性標註,實體識別。現釋出 Java 版。

<dependency>  <groupId>me.midday</groupId>  <artifactId>JFoolNLTK</artifactId>  <version>1.0</version></dependency>

Example

// 單文字 String text = "北京歡迎你"; LexicalAnalyzer lexicalAnalyzer = FoolNLTK.getLSTMLexicalAnalyzer(); // 分詞 List<List<Word>> words = lexicalAnalyzer.cut(text); for(List<Word> ws: words){    ws.forEach(System.out::println); } // 詞性標註 List<List<Word>> posWords = lexicalAnalyzer.pos(text); for(List<Word> ws: posWords){    ws.forEach(System.out::println); } // 實體識別 List<List<Entity>>  entities = lexicalAnalyzer.ner(text);  for(List<Entity> ents :entities){    ents.forEach(System.out::println); } // 分詞,詞性,實體識別 List<AnalysisResult>  results = lexicalAnalyzer.analysis(text); results.forEach(System.out::println);   // 多文字  System.out.println(); System.out.println("多文字:"); List<String> docs = new ArrayList<>(); docs.add(text); docs.add(text); // 分詞 List<List<Word>> dWords = lexicalAnalyzer.cut(docs); for(List<Word> ws: dWords){    ws.forEach(System.out::println); } // 詞性標註 List<List<Word>> dPosWords = lexicalAnalyzer.pos(docs); for(List<Word> ws: dPosWords){    ws.forEach(System.out::println); }List<List<Entity>>  dEntities = lexicalAnalyzer.ner(docs);  for(List<Entity> ents :dEntities){    ents.forEach(System.out::println); } // 分詞, 詞性標註,實體識別 List<AnalysisResult>  dResults = lexicalAnalyzer.analysis(docs); dResults.forEach(System.out::println);

GitHub  
碼雲

FoolNLTK 釋出 Java 版,基於深度學習的中文文字處理工具原文請看這裡