怎么办本人没文化,一句(哔 ——)行天下。这位胖友,不知你行走江湖,是否也有过这样的烦恼?那么这里有个神器,可就值得好好说道说道了。
“听我说谢谢你,因为有你,温暖了四季”用成语应该怎样说?在查找框内输入你想表达的意思,再在词性一栏里选择成语,AI 立马就能给你抛出几十上百个选项。布景颜色越深,代表系统举荐程度越高。
要是碰上啥看不懂的,鼠标一点,就能检查具体释义。
还不只仅中文,比方当你想信口开河一句“鹅妹子嘤”,但又想知道有没有更绮丽的中文表达,同样是一键即可得。
怎样样,够便利不?是不是有点“妈妈再也不用担心我词穷”内味儿了(手动狗头)。
来自清华的“反向词典”
这个神器名叫 WantWords,反向词典。
反面的 AI,来头不小:诞生自清华大学自然言语处理与社会人文核算实验室,项目指导教师为孙茂松教授和刘知远副教授。所谓“反向”,就是和惯例词典不同,不是按词寻义,而是反过来给词典一段描述,让它来帮你找词。
作者在 GitHub 中介绍,他们希望反向词典起到三种作用:
-
解决话到嘴边,却遽然想不起来怎样说的“舌尖现象”
-
帮忙新言语学习者
-
帮忙无法选择单词的失读症患者
这个反向词典反面的核心 AI,名为多通道逆向词典模型,相关论文还中选过 AAAI 2020。
具体而言,多通道逆向词典模型选用了双向 LSTM(BiLSTM)和注意力作为根本结构,并在其间参与了 4 个特定特征预测器。选用多个预测器来辨认输入查询中政策词的不同特征,一方面,能使嵌入质量较差的政策词经过特征被选择出来。另一方面,也可以过滤掉与正确政策词有接近嵌入、但存在对立特征的词。
也就是说,AI 选词能更精准。
而为了让 AI 更简单找到真实“正确”的词,除了词性、词素这两个词语的“内部特征”外,作者还考虑了层次系统和义原这两个“外部特征”。
所谓层次系统,是用来区别一个词是实体仍是概念,实体下面又会分出林林总总的实体。
义原在言语学中则是指最小的不行再分的语义单位。言语学家以为义原系统在任何言语中都适用,不与特定言语相关。
举个比方,“男孩”这个词可以由“人类”、“男性”、“儿童”这个三个义原表示,“女孩”则可以由“人类”、“女人”、“儿童”的组合来表达。
△ 图源:HowNet
新算法已测试,相关新系统开发中
前文说到,WantWords 反向词典最早诞生于清华 NLP 实验室,主要由岂凡超和张磊在 2019 年合作完成。
在与果壳沟通时岂凡超谈到,刚开端,他们并没有对这个项目进行推广,仅仅身边的同学使用后反应还不错。直到上一年 11 月,这个项目忽然火爆,一时之间访问量暴增,把服务器都给挤垮了。自此之后,WantWords 开端遭到更多重视,也收获了不少建议和来自志愿者的技术支撑。
不只有了网页版,微信小程序也已正式上线,还有 App 版正在开发中。
△ 微信小程序“WantWords”
根据研制团队的最新公告,今年岁除之前,反向查词还测试完成了新算法,其功能相较于原有算法有明显提高。而在反向词典之外,研讨团队还开发“名言名句语义检索及举荐系统”,以及“汉语词语调配查询系统”。
现在这两个系统没有对外开放,感兴趣的小伙伴可以边读论文(文末奉上),边蹲一波。
对了,研制团队还表示,WantWords 作为一个开源项目,随时欢迎咱们参与,参与规划 & 开发、提出需求、反应问题。感兴趣的话就去官网戳戳公告吧~
相关论文:
https://arxiv.org/abs/1912.08441
https://arxiv.org/abs/2202.13145
参看链接:
[1] 官网:https://wantwords.net/
[2] 果壳文章:https://mp.weixin.qq.com/ s / er-JwST7dUQjMh6VzBE1bA
[3]https://deeplang.feishu.cn/docs/doccnoH9ncCZspo2Ubx79bpZ0Lh#ijyigh