A fundamental study of effective visualization and description of longitudinal changes of classical Japanese poetic vocabulary
日本古典诗歌词汇纵向变化的有效可视化和描述的基础研究
基本信息
- 批准号:18K00528
- 负责人:
- 金额:$ 2.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2018
- 资助国家:日本
- 起止时间:2018-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
可視化を行う上で重要なグラフ理論で用いられるノードとエッジ描画に関わる計算方法の見直しを行った。任意の2単語をノード、その2単語を結ぶ線をエッジと呼ぶが、この2ノード1エッジの選び方にはさまざまな方法がある。何らかの基準で2単語のそれぞれに数値やベクトルを与え、それらの2単語間の距離を計算し、距離の遠近で、その2単語を結ぶエッジを描画するか否かを決定する。単語に与える値として頻度が考えられるが、機能語の頻度は高く、内容語の頻度は低い。idf(invert document frequency)を利用すると、内容語の値が高くなり、機能語の値は低くなり、キーワード性の高い語と低い語の視点から描画できることがわかった。次に、エッジの選び方に関する方法を検討した。①エッジは2単語の値の幾何平均を用いる方法、②2幾何平均とエッジの出現数を掛ける方法、③その2単語がどこにでも出てくるか、特定のところにしか出てこない(あるいは単純に頻度が低い場合)かを計算し、その値を用いる方法、④それらを複合した方法、を検討した。結果として、これらの値は、分析の領域によって異なることがわかった。現代語の場合には長い文も短い文もあるだけでなく、同じ文に同じ語が複数回出てきた。一方、和歌は、31文字という制約で書かれた文であるためか、出てきて2回、ほとんどが1回出現する単語ばかりであった。和歌の可視化においてどのエッジを描画するかは、単純に①の2単語のidf値の幾何平均で大方表現できることがわかった。ここで得られた値をcw(cooccurrence weight)と呼ぶことにする。cwの特性を調査した。ある単語とその単語を持つ文脈、すなわち和歌のcw値の分布を調べたところ、ほぼ正規分布のような釣鐘状の分布になることがわかった。
我们已经回顾了与节点和边缘图有关的计算方法,这些方法用于图理论中,这对于可视化很重要。任何两个单词称为节点,连接两个单词的线称为边缘,但是有多种选择此两节点1边缘的方法。按照标准,给出了两个单词中的每个单词的数值或向量,两个单词之间的距离被计算出来,并且它们之间的距离确定是否在距离的角度绘制连接两个单词的边缘。频率可以视为给出单词的值,但是功能单词的频率很高,内容词的频率很低。发现使用IDF(倒文档频率)增加了内容词的值并降低功能单词的价值,从而从具有高关键字和低关键字的单词的角度绘制。接下来,我们考虑了选择边缘的方法。我们研究了1)使用两个单词值的几何平均值,2)一种将两个几何平均值乘以边缘的发生数量的方法,3)一种计算两个单词是否出现在任何地方或仅出现在特定位置的方法(或仅在特定的位置出现(或简单地出现在特定的位置)),以及使用这些方法,以及使用这些方法,以及4)一种方法。结果,发现这些值取决于分析区域。在现代语言中,不仅有长句和短句子,而且同一句子中多次出现同一单词。另一方面,Waka诗人的写作具有31个字符的约束,其中大多数出现一次,也许是因为它们是用句子写的。已经发现,在Waka诗可视化中绘制的边缘可以简单地通过两个单词的IDF值的几何平均值来表示。此处获得的值称为CW(共振重量)。研究了CW的特征。当我们检查单词的CW值的分布和该单词的上下文(即Waka诗)时,我们发现这是一个钟形的分布,看起来几乎是正常的。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An Analysis of the Differences Between Classical and Contemporary Poetic Vocabulary of the Kokinshu
古今集古典与现代诗词差异分析
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Hilofumi Yamamoto;Bor Hodoscek
- 通讯作者:Bor Hodoscek
Co-occurrence weights and the distribution pattern of classical Japanese vocabulary
日语古典词汇的共现权重与分布模式
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Hilofumi Yamamoto;Bor Hodoscek;Hilofumi Yamamoto
- 通讯作者:Hilofumi Yamamoto
A fundamental study of effective visualization and description of longitudinal changes of classical Japanese poetic vocabulary
日本古典诗歌词汇纵向变化的有效可视化和描述的基础研究
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Hilofumi Yamamoto;Bor Hodoscek
- 通讯作者:Bor Hodoscek
Development of datasets of the Hachidaishu and tools for the understanding of the characteristics and historical evolution of classical Japanese poetic vocabulary
开发《八大集》数据集和了解日本古典诗歌词汇特征和历史演变的工具
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Bor Hodoscek;Yamamoto Hilofumi
- 通讯作者:Yamamoto Hilofumi
Visualization of classical Japanese poetic vocabulary
日本古典诗歌词汇的可视化
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Hilofumi Yamamoto;Bor Hodoscek;Hilofumi Yamamoto;Bor Hodoscek
- 通讯作者:Bor Hodoscek
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
山元 啓史其他文献
リジット解析:計数データを用いた言語研究への適用
刚性分析:使用数值数据进行语言研究的应用
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
山元 啓史;村井源;ボル ホドシチェク;高山知明;山元啓史;石井正彦 - 通讯作者:
石井正彦
外国人留学生の修学サポート -香川高専詫間キャンパスの取り組み-
留学生学习支援 - 香川工业大学琢间校区的举措 -
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
佐藤 礼子;榎原 実香;小松 翠;山元 啓史;塩入すみ;河野麻耶,内田由理子 - 通讯作者:
河野麻耶,内田由理子
二〇世紀後半の書きことばにおける「抽象的な外来語の基本語化」について-語彙の周辺部から中心部へ「進出」する外来語-
论20世纪下半叶书面语言的“抽象外来词向基本词的转化”——外来词从词汇的外围“进步”到词汇的中心——
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
山元 啓史;ホドシチェク ボル;金 愛蘭 - 通讯作者:
金 愛蘭
オノマトペの構造と音変化:日本語の脱唇音化に関する事例研究(ポスター発表)
拟声词的结构和声音变化:日语去唇化的案例研究(海报展示)
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
山元 啓史;村井源;ボル ホドシチェク;石井正彦;高山知明 - 通讯作者:
高山知明
山元 啓史的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('山元 啓史', 18)}}的其他基金
Development of tools and datasets to analyze the characteristics of the historical evolution of Japanese classical poetic vocabulary
开发分析日本古典诗歌词汇历史演变特征的工具和数据集
- 批准号:
23K00545 - 财政年份:2023
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
外国人研究者のための科学技術日本語読解CAIの開発
科学技术的发展 面向外国研究人员的日语阅读理解CAI
- 批准号:
07858026 - 财政年份:1995
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
Signaling効果を応用した日本語科学技術文献読解支援データベースの開発
利用信号效应开发支持日本科技文献阅读理解的数据库
- 批准号:
05858028 - 财政年份:1993
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
Development of tools and datasets to analyze the characteristics of the historical evolution of Japanese classical poetic vocabulary
开发分析日本古典诗歌词汇历史演变特征的工具和数据集
- 批准号:
23K00545 - 财政年份:2023
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Prince Tokiyasu's and Prince Tsuneyasu's salon; Research on expressions in Henjo's waka as a steppingstone
时安亲王和常安亲王的沙龙;
- 批准号:
19K13057 - 财政年份:2019
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
幼児のためのアプローチカリキュラム「言葉領域モデルプログラム」の開発と運用
幼儿入门课程“语言领域模型课程”的开发与运营
- 批准号:
18K18673 - 财政年份:2018
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
A Discourse and Expression Analysis of the Regional Characteristics and Regional Differences in Oral Literature and Everyday Language
口述文学与日常语言的地域特征与地域差异的话语表达分析
- 批准号:
16K16847 - 财政年份:2016
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
A study on a educational history on languages in modern Okinawa
近代冲绳语言教育史研究
- 批准号:
15K04205 - 财政年份:2015
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)