导航
百度吴华:NLP技术要让机器具有人类语言交流能赖上无良痞公主
百度吴华:NLP技术要让机器具有人类语言交流能赖上无良痞公主
百度吴华:NLP技术要让机器具有人类语言交流能赖上无良痞公主

  “要让人工智能走进人类的生活,就需要让它们具有与人类交流的语言能力。自然语言处理(NLP)是人工智能的核心领域之一,是解决这一问题的核心途径。研究好NLP就能让计算机理解和生成人类语言,以我们熟悉的方式服务人类。”百度技术委员会主席吴华在国际自然语言处理与中文计算会议(NLPCC)上诠释了NLP技术的重要意义。

  NLPCC 2017由中国计算机协会(CCF)主办,是具有国际影响力的学术与创新交流平台。百度技术委员会主席、百度自然语言处理部门技术负责人吴华应邀出席,并在会上介绍了百度NLP技术的发展现状和产品应用能力。

  吴华表示,百度NLP以大数据和知识图谱为立足点,基于机器学习和语言学方面的积累,拥有一流的文本理解与生成技术,由此构建起问答、机器翻译和对话系统,并以平台化的方式对更多产品进行支持,如NLPC(NLP Cloud)和百度AI开放平台。百度NLP技术已经应用在搜索、信息流、DuerOS等百度的众多产品上。

  凭借多年的技术积累,百度研发了一套联合统一的词法分析方案,极大提高了机器正确识别和标注句子中词的概率。吴华表示,词法分析是自然语言处理的基础,其准确程度直接影响后续一系列分析处理任务的效果。百度的这套方案将专名识别(NE Recognition)、分词和词性标注统一在一个框架中,得到语义更合理和完整的词语切分与词性标注序列;另一方面,百度特有的海量点击反馈数据辅助词性标注将词性标注语料从20万迅速扩充到1亿3千万个句子,标记数据精度超过95%,提升了自动分词和词性标注的准确率。

  在介绍百度先进的文本理解与生成技术能力时,吴华强调,不同应用对文本理解的程度和解析粒度的要求不同,一套固定的解决方案无法满足所有需求。目前,百度NLP不仅拥有通用的理解技术,更面向不同任务提供相应的文本理解技术,实现更精准的意图理解、推荐、人机对话等。在搜索中,使用基于深度学习模型的多层次语义匹配技术,搜索结果的关联度将大幅提升。例如,在应用深度学习模型前,搜索“水泵忽强忽弱”结果是不相关的,应用之后的关联度大幅提升。而在基于知识库问答和面向任务的对话系统中,使用精细的句法分析和语义角色标注技术,可以准确定位和理解用户意图。

  篇章理解是文本理解的另一核心组成,吴华表示,“NLP技术可以通过用户兴趣网络和文档语义网络形成标签图谱,最终得到‘不搜即得’的智能推荐。”该技术以用户兴趣为出发点,依托从搜索、贴吧、百科等不同渠道获得的有明确含义的主题、话题或实体等内容标签,形成可实时更新的关注点标签图谱。在下面这张关注点标签图谱中,“AI”话题与“科技”、“VR”等话题,“乌镇峰会”等事件关联在一起。基于关注点图谱对文档内容进行标注,可以更好地描述用户与文章之间的关系,从用户的视角对篇章进行更合理的分类和有效的推荐。

  吴华在现场向观众展示了两首五言绝句,多数人都难以区分哪一首是由百度机器创作的。目前,百度人工智能撰写的文章通过消息推送、资讯流、开放订阅、百家号等途径进行分发,供用户阅读。

  基于上述多项技术能力的积累,百度已经构建起问答、对话和机器翻译三大系统。在问答方面,面对用户提出的问题,系统可基于知识图谱加以回答。吴华坦言,没有理解或推理仍是问答领域的巨大挑战,对此,百度日前推出了世界上最大的中文机器阅读理解数据集——DuReader,该数据集基于真实应用需求,所有问题来源于百度搜索用户的真实问题,文档来自全网真实采样的网页文档和知道UGC文档,答案基于问题与文档人工撰写生成,目前拥有20万个问题和100万个文档;同时,数据集标注了问题类型、实体和观点等丰富信息,弥补了现有主流数据集对于观点类问题覆盖不足的问题。

 菜鸟和中国主要快递公司共推智慧升级惟妙惟肖空城旧梦 领投中科慧眼 百度Apollo加速自动驾驶量产se.10sqz.com 手机扣费乱象惊人:号码未用就已数次交费北京德翰集团董事长 工信部:1亿以上用户信息泄露为特大网络安全事www.33ri.com 深交所向华大基因发问询函:说明IPO文件数据不爱在阿拉斯加冰川下 12月1日起新规:网盘涉淫秽信息依法可追刑事责加一欢网 取消销售模式 不设4S店的蔚来汽车怎么玩?2014大崩溃 传A站已被关停 网站已三天无法登录人鱼症候群 “雪人计划”在全球架设IPv6根服务器 中国部署dnf米娅里克特在哪 郭台铭让夏普电视疯狂降价 惹怒彩电业对手太古天帝传 高德地图三季度交通报告:37%城市拥堵下降www.dengxiaojin.cn 张一鸣的“分身”畅聊短视频全民变现小狒狒音乐天空 国家食药监总局携手腾讯 共建食药安全社会综琼瑶之知情者 周鸿祎提出“大安全”六大关键词洪荒第一仙 搜索三家格局已定? 360搜索凭借内容战略单挑百龙发空包 三节课举办首届有可能互联网大烩 推出新课程杀神的闪婚爱人 阿里穷尽手段追责售假商家:要让售假者知道疼丑汉霸两美妻 中国工商银行与京东金融首创“工银小白”数字www.zqliveba.com 免押金之火烧到国外 中国人境外租车也能免押www.yanqing888.net 聚焦顶级密码学竞赛 为生活安全层层加密taohuazu.tv 今日头条赵添:虚假的粉丝数据 没有任何意义迅捷烈日古器 8848启动“领读者”公益计划 带领全民阅读豆瓣第三帅 唐嫣回母校原始部落生存录 沈梦辰换发型www.typta.com.cn 黄渤不在意错失金马奖?一个举动出卖了他淘信客 开会不忘撒狗粮 黄晓明轻挑baby下巴www.sao30.com 王源李小璐晋升店长 责任感满满范哥老雷 林更新朱桢养猪 还给它们取了个名字青色大陆第二部 陈赫自带篮球框架 为运动会蓄势待发爱器吧 你老公掉地上了, 还不捡起来?信得乐n88

封面强推

总裁霸爱,老公请节制

作者:疯兮兮

“求求你,放过我……”一场惊心设计,叶薇表示就当被狗咬了一口算了,可眼前的这...

风流术士

作者:土豆

本是都市小屌丝,一场意外,却让他成为了豪门座上宾;他是巨富门中客;看得一手好风水...

万鬼万仙

作者:失落之节操君

世有万仙一派,自诩仙人,千年来风光无二,势力无双。又有万鬼门,神神秘秘,不知底细...

全能妖孽兵王

作者:酸酸酸酸

无论是在战场,还是在都市,老子都是王者!还有我只说一遍,虽然我有透视眼,...

快穿:傲娇女配养成记

作者:渴望飞的鱼

1V1宠文,只有一个男主!!!金手指什么根本不算什么!我们有男配这个最粗的金...

妖孽兽夫,轻点宠

作者:香凝凝香

穿越成修仙废柴的下堂妃?这是要下堂妃逆袭的节奏?然而,不善宅斗的溏心很快将这出戏...

玄幻小说更多...

修真小说更多...

都市小说更多...

网游小说更多...

女生小说更多...

友情链接