AI 技术妙用,清华搞了个神器专治词穷

js 原创
2022-05-16 电脑百科网

怎么办本人没文化,一句(哔 ——)行天下。这位胖友,不知你行走江湖,是否也有过这样的烦恼?那么这里有个神器,可就值得好好说道说道了。

“听我说谢谢你,因为有你,温暖了四季”用成语应该怎样说?在查找框内输入你想表达的意思,再在词性一栏里选择成语,AI 立马就能给你抛出几十上百个选项。布景颜色越深,代表系统举荐程度越高。

要是碰上啥看不懂的,鼠标一点,就能检查具体释义。

还不只仅中文,比方当你想信口开河一句“鹅妹子嘤”,但又想知道有没有更绮丽的中文表达,同样是一键即可得。

怎样样,够便利不?是不是有点“妈妈再也不用担心我词穷”内味儿了(手动狗头)。

来自清华的“反向词典”

这个神器名叫 WantWords,反向词典。

反面的 AI,来头不小:诞生自清华大学自然言语处理与社会人文核算实验室,项目指导教师为孙茂松教授和刘知远副教授。所谓“反向”,就是和惯例词典不同,不是按词寻义,而是反过来给词典一段描述,让它来帮你找词。

作者在 GitHub 中介绍,他们希望反向词典起到三种作用:

  • 解决话到嘴边,却遽然想不起来怎样说的“舌尖现象”

  • 帮忙新言语学习者

  • 帮忙无法选择单词的失读症患者

这个反向词典反面的核心 AI,名为多通道逆向词典模型,相关论文还中选过 AAAI 2020。

具体而言,多通道逆向词典模型选用了双向 LSTM(BiLSTM)和注意力作为根本结构,并在其间参与了 4 个特定特征预测器。选用多个预测器来辨认输入查询中政策词的不同特征,一方面,能使嵌入质量较差的政策词经过特征被选择出来。另一方面,也可以过滤掉与正确政策词有接近嵌入、但存在对立特征的词。

也就是说,AI 选词能更精准。

而为了让 AI 更简单找到真实“正确”的词,除了词性、词素这两个词语的“内部特征”外,作者还考虑了层次系统和义原这两个“外部特征”。

所谓层次系统,是用来区别一个词是实体仍是概念,实体下面又会分出林林总总的实体。

义原在言语学中则是指最小的不行再分的语义单位。言语学家以为义原系统在任何言语中都适用,不与特定言语相关。

举个比方,“男孩”这个词可以由“人类”、“男性”、“儿童”这个三个义原表示,“女孩”则可以由“人类”、“女人”、“儿童”的组合来表达。

△ 图源:HowNet

新算法已测试,相关新系统开发中

前文说到,WantWords 反向词典最早诞生于清华 NLP 实验室,主要由岂凡超和张磊在 2019 年合作完成。

在与果壳沟通时岂凡超谈到,刚开端,他们并没有对这个项目进行推广,仅仅身边的同学使用后反应还不错。直到上一年 11 月,这个项目忽然火爆,一时之间访问量暴增,把服务器都给挤垮了。自此之后,WantWords 开端遭到更多重视,也收获了不少建议和来自志愿者的技术支撑。

不只有了网页版,微信小程序也已正式上线,还有 App 版正在开发中。

△ 微信小程序“WantWords”

根据研制团队的最新公告,今年岁除之前,反向查词还测试完成了新算法,其功能相较于原有算法有明显提高。而在反向词典之外,研讨团队还开发“名言名句语义检索及举荐系统”,以及“汉语词语调配查询系统”。

现在这两个系统没有对外开放,感兴趣的小伙伴可以边读论文(文末奉上),边蹲一波。

对了,研制团队还表示,WantWords 作为一个开源项目,随时欢迎咱们参与,参与规划 & 开发、提出需求、反应问题。感兴趣的话就去官网戳戳公告吧~

相关论文:

https://arxiv.org/abs/1912.08441

https://arxiv.org/abs/2202.13145

参看链接:

[1] 官网:https://wantwords.net/

[2] 果壳文章:https://mp.weixin.qq.com/ s / er-JwST7dUQjMh6VzBE1bA

[3]https://deeplang.feishu.cn/docs/doccnoH9ncCZspo2Ubx79bpZ0Lh#ijyigh

韩国数据中心火灾事故后续,两大互联网巨头创始人向国民道歉 反垄断审查愈演愈烈,苹果是时候开发搜索引擎挑战谷歌了 国内首个基于车联网安全的自动驾驶开放测试道路通过审核 Netflix 网飞买下首个游戏工作室,但不打算继续疯狂收购 比尔盖茨被曝 2008 年曾被微软高管劝诫:停止向女员工发不当电邮 微信宣布治理个人账号“恶意营销行为”,已处理逾 9 万个账号
热门文章
为你推荐