一、简介 同义词挖掘一般有三种思路,借助已有知识库,上下文相关性,文本相似度。 1.1 知识库 可以借助已有知识库得到需要同义词,比如说《哈工大信息检索研究室同义词词林扩展版》和 HowNet,其中《词林》文件数据如下。 Aa01A01= 人 士 人物 人士 人氏 人选 Aa01A02= 人类 生人 全人类 Aa01A03= 人手 人员 人口 人丁 口 食指 Aa01A04= 劳力 劳动力 工作者 Aa01A05= 匹夫 个人 Aa01A06= 家伙 东西 货色 厮 崽子 兔崽子 狗崽子 小子 杂种 畜生 混蛋 王…

2020年12月2日 0条评论 13点热度 阅读全文

1.减低劳动成度,解放双手,输入速度加快 2.语音转换时会先输入搜狗app再转应用 3.语言种类小 4.方言种类小 5.断网不能用 6.多音字不能识别 7.输入法扩展功能太多,卡顿 8.每说一个字就会有标点符号 9.翻译时会出现错别字,需要手动改正 10.戴耳机可能录不到全部详细内容 11.离线语音包还需要下载 12.按钮太小看不清楚 13.点击进入上方的语音转文字的页面,如果没有注意到要说话,就自动进入请说话功能,这方面用户体验差 14.识别数字但是不能转成阿拉伯数字 15.可以截图翻译 16.语音转文字会有时间…

2020年11月26日 0条评论 13点热度 阅读全文

/* 版权声明:可以任意转载,转载时请标明文章原始出处和作者信息 .*/                                                      autho…

2020年11月17日 0条评论 12点热度 阅读全文

和自然语言处理有关的英语 Natural Language Processing (NLP) is growing in use and plays a vital role in many systems from resume-parsing for hiring to automated telephone services. You can also find it in commonly used technology such as chatbots, virtual assistants, and m…

2020年10月14日 0条评论 11点热度 阅读全文

搜索引擎技术之概要预览 前言     近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索引,查询,排序等等,更惊叹于每一幅精彩的架构图,特此,便有记录下来的冲动,以作备忘。     本文从最基本的搜索引擎的概念谈起,到全文检索的概念,由网络蜘蛛,分词技术,系统架构,排序的讲解(结合google搜索引擎的技术原理),而后到图片搜索的原理,最终以几个开源搜索引擎…

2020年6月27日 0条评论 11点热度 阅读全文

前言:与老牌学科如物理学、化学等相比,计算机学科还非常年轻,学科体系长期处于剧烈变革之中。作为计算机应用的重要方向,人工智能和自然语言处理自然更不例外,与现实应用紧密相关,技术发展日新月异,常给人今是昨非之感。在这种情况下,传统学术期刊的那种投稿1-2年才能见刊的模式已经赶不上技术革新的速度,年度学术会议显然更符合计算机学科发展和交流的需求,可以看作是一种“小步快跑”的模式。阅读学术论文、参加学术会议是进入学术界、走进学术前沿的重要方式,在学术会议上,不仅可以集中听取最新的成果报告,还有讲习班(Tutorial)、…

2020年5月30日 0条评论 12点热度 阅读全文

常用对照: NLP CRF算法: 中文名称条件随机场算法,外文名称conditional random field algorithm,是一种数学算法,是2001年提出的,基于遵循马尔可夫性的概率图模型。 全部对照 第一部分、计算机算法常用术语中英对照 Data Structures 基本数据结构 Dictionaries 字典 Priority Queues 堆 Graph Data Structures 图 Set Data Structures 集合 Kd-Trees 线段树 Numerical Proble…

2020年5月11日 0条评论 11点热度 阅读全文

欢迎关注“百度NLP”官方微信公众号,及时获取更多自然语言处理领域的技术干货! 2019年12月30日,百度大脑智能创作平台上线全新版本,带来更多新功能,助力用户解决创作痛点,提升创作效率。   百度大脑智能创作平台发布于19年4月2日,集合了百度领先的自然语言处理和知识图谱技术,旨在成为更懂用户的智能创作助手。   百度较早开始探索智能创作技术和相关应用,积累了丰富的经验,也深刻理解了媒体创作者的痛点。针对提升创作效率的问题,百度大脑智能创作平台为用户提供了高效、易用的自动创作和辅助创作能力,…

2020年5月9日 0条评论 10点热度 阅读全文

在Mac上使用vim/vi编辑工具时,将光标移动到行尾的快捷键是shift + 4 .

2020年3月17日 0条评论 9点热度 阅读全文

需求说明: (1)将计算机本地文档集中的文本进行分词、词性标注,最后进行命名实体识别。 (2)将(1)中处理结果保存到本地txt文件中。 技术选择: 本需求的实现使用了哈工大的pyltp,如果你对ltp还不太了解,请点击这里或者去哈工大语言云官网了解相关内容。 完整代码展示: # -*- coding: utf-8 -*- import os import jieba LTP_DATA_DIR = 'D:\pyprojects\LTP\ltp_data' # ltp模型目录的路径 cws_model_path = …

2020年2月28日 0条评论 9点热度 阅读全文