Atitit nlp用到的技术与常见类库
目录
1. 常用的技术 1
1.1. 语言处理基础技术 分词 相似度等 1
1.2. 新闻摘要 2
1.3. 情感倾向分析 2
1.4. 文章标签 2
1.5. 文章分类 2
1.6. 文本审核 2
1.7. 机器翻译 2
1.8. 智能写作平台 3
2. Ati常用技术 3
2.1. 分词 关键词提取 3
2.2. 摘要 关键词提取 与目录提取 3
2.3. 抽取 3
2.4. 索引与 检索 3
2.5. Zip压缩文档抽取技术 3
2.6. Office pdf系列文档读取技术 3
2.7. Eml html系列温暖的读取技术 3
3. Nlp常用类库 3
3.1. Mmseg分词, 3
3.2. 文档读取处理类 3
3.3. 索引与检索类 4
4. Ref 4
常用的技术
语言处理基础技术 分词 相似度等
词法分析
依存句法分析
词向量表示
DNN语言模型
词义相似度
短文本相似度
语言处理应用技术
文本纠错
对话情绪识别
新闻摘要
情感倾向分析 文章标签
评论观点抽取
文章分类 文本审核 机器翻译
通用翻译API
拍照翻译SDK
定制化翻译API
垂直领域API
语音翻译SDK
语种识别API
智能写作平台 Ati常用技术
分词 关键词提取 摘要 关键词提取 与目录提取
Html文档摘要提取
抽取 索引与 检索 Zip压缩文档抽取技术 Office pdf系列文档读取技术 Eml html系列温暖的读取技术 Nlp常用类库
Mmseg分词, 文档读取处理类
mail类库,poi类库(处理officex系列),jsoup html类库。
org.apache.tools.zip_1.9.6 处理zip库
java-unrar 处理rar文档
pdfbox-1.8.16.jar
索引与检索类
Lucence imap类库mail。Jar zip库读取库
Ref
百度ai
Atitit nlp 自然语言处理的艺术 attilax著作 v2 t55.docx
Atitit nlp 自然语言处理attilax总结 dep