喵ID:c6TZK4免责声明

Interactive Visualizations of Word Embeddings for K-12 Students

基本信息

DOI:
10.1609/aaai.v36i11.21548
发表时间:
2022-06
期刊:
影响因子:
--
通讯作者:
Saptarashmi Bandyopadhyay;Jason Xu;Neel Pawar;D. Touretzky
中科院分区:
其他
文献类型:
--
作者: Saptarashmi Bandyopadhyay;Jason Xu;Neel Pawar;D. Touretzky研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

Word embeddings, which represent words as dense feature vectors, are widely used in natural language processing. In their seminal paper on word2vec, Mikolov and colleagues showed that a feature space created by training a word prediction network on a large text corpus will encode semantic information that supports analogy by vector arithmetic, e.g., "king" minus "man" plus "woman" equals "queen". To help novices appreciate this idea, people have sought effective graphical representations of word embeddings. We describe a new interactive tool for visually exploring word embeddings. Our tool allows users to define semantic dimensions by specifying opposed word pairs, e.g., gender is defined by pairs such as boy/girl and father/mother, and age by pairs such as father/son and mother/daughter. Words are plotted as points in a zoomable and rotatable 3D space, where the third ”residual” dimension encodes distance from the hyperplane defined by all the opposed word vectors with age and gender subtracted out. Our tool allows users to visualize vector analogies, drawing the vector from “king” to “man” and a parallel vector from “woman” to “king-man+woman”, which is closest to “queen”. Visually browsing the embedding space and experimenting with this tool can make word embeddings more intuitive. We include a series of experiments teachers can use to help K-12 students appreciate the strengths and limitations of this representation.
词嵌入将单词表示为密集的特征向量,在自然语言处理中被广泛使用。在关于word2vec的开创性论文中,米可洛夫及其同事表明,通过在大型文本语料库上训练一个单词预测网络所创建的特征空间将编码语义信息,这些信息支持通过向量运算进行类比,例如,“国王”减去“男人”加上“女人”等于“王后”。为了帮助新手理解这一概念,人们一直在寻求词嵌入的有效图形表示方法。我们描述了一种用于可视化探索词嵌入的新型交互工具。我们的工具允许用户通过指定相反的单词对来定义语义维度,例如,性别可由诸如男孩/女孩和父亲/母亲这样的对来定义,年龄可由诸如父亲/儿子和母亲/女儿这样的对来定义。单词被绘制为可缩放和可旋转的3D空间中的点,其中第三个“剩余”维度编码了与所有减去年龄和性别后的相反单词向量所定义的超平面的距离。我们的工具允许用户可视化向量类比,绘制从“国王”到“男人”的向量以及从“女人”到“国王 - 男人 + 女人”(最接近“王后”)的平行向量。可视化浏览嵌入空间并使用该工具进行实验可以使词嵌入更直观。我们包含了一系列教师可以用来帮助K - 12学生理解这种表示方法的优势和局限性的实验。
参考文献(27)
被引文献(5)

数据更新时间:{{ references.updateTime }}

关联基金

Saptarashmi Bandyopadhyay;Jason Xu;Neel Pawar;D. Touretzky
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓