A fundamental study of effective visualization and description of longitudinal changes of classical Japanese poetic vocabulary

日本古典诗歌词汇纵向变化的有效可视化和描述的基础研究

基本信息

  • 批准号:
    18K00528
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2018
  • 资助国家:
    日本
  • 起止时间:
    2018-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

可視化を行う上で重要なグラフ理論で用いられるノードとエッジ描画に関わる計算方法の見直しを行った。任意の2単語をノード、その2単語を結ぶ線をエッジと呼ぶが、この2ノード1エッジの選び方にはさまざまな方法がある。何らかの基準で2単語のそれぞれに数値やベクトルを与え、それらの2単語間の距離を計算し、距離の遠近で、その2単語を結ぶエッジを描画するか否かを決定する。単語に与える値として頻度が考えられるが、機能語の頻度は高く、内容語の頻度は低い。idf(invert document frequency)を利用すると、内容語の値が高くなり、機能語の値は低くなり、キーワード性の高い語と低い語の視点から描画できることがわかった。次に、エッジの選び方に関する方法を検討した。①エッジは2単語の値の幾何平均を用いる方法、②2幾何平均とエッジの出現数を掛ける方法、③その2単語がどこにでも出てくるか、特定のところにしか出てこない(あるいは単純に頻度が低い場合)かを計算し、その値を用いる方法、④それらを複合した方法、を検討した。結果として、これらの値は、分析の領域によって異なることがわかった。現代語の場合には長い文も短い文もあるだけでなく、同じ文に同じ語が複数回出てきた。一方、和歌は、31文字という制約で書かれた文であるためか、出てきて2回、ほとんどが1回出現する単語ばかりであった。和歌の可視化においてどのエッジを描画するかは、単純に①の2単語のidf値の幾何平均で大方表現できることがわかった。ここで得られた値をcw(cooccurrence weight)と呼ぶことにする。cwの特性を調査した。ある単語とその単語を持つ文脈、すなわち和歌のcw値の分布を調べたところ、ほぼ正規分布のような釣鐘状の分布になることがわかった。
我们回顾了图论中与节点和边绘制相关的计算方法,这对于可视化很重要。任意两个单词称为一个节点,连接两个单词的线称为一条边。选择这两个节点和一条边的方法有多种。基于某种标准给两个单词中的每一个赋予数值或向量,计算两个单词之间的距离,并根据该距离确定是否绘制连接两个单词的边。频率可以认为是赋予词的一个值,但功能词的频率较高,实词的频率较低。发现通过使用idf(倒置文档频率),实词的值变高,虚词的值变低,并且可以从关键词特征高低的词的角度进行绘制。接下来,我们考虑选择边缘的方法。 (1)对于边缘,使用两个单词的值的几何平均值,(2)将两个单词的几何平均值乘以边缘出现的次数,(3)如果两个单词出现在任何地方或仅出现在特定位置(或者简单地说,我们考虑了计算(如果频率较低)并使用该值的方法,以及(4)将它们结合起来的方法。结果发现,这些值根据分析区域的不同而有所不同。就现代语言而言,不仅有长句和短句,而且同一个单词在同一个句子中出现多次。另一方面,在和歌诗歌中,大多数单词出现两次,大多数单词出现一次,可能是因为句子的长度限制为 31 个字符。我们发现可视化waka时画哪条边可以简单地用①中两个词的idf值的几何平均值来表示。这里获得的值将被称为cw(共现权重)。研究了CW的特性。当我们调查一个单词及其上下文(即日本诗歌)的cw值分布时,我们发现它具有几乎正态分布的钟形分布。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An Analysis of the Differences Between Classical and Contemporary Poetic Vocabulary of the Kokinshu
古今集古典与现代诗词差异分析
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hilofumi Yamamoto; Bor Hodoscek
  • 通讯作者:
    Bor Hodoscek
Co-occurrence weights and the distribution pattern of classical Japanese vocabulary
日语古典词汇的共现权重与分布模式
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hilofumi Yamamoto
  • 通讯作者:
    Hilofumi Yamamoto
単語アライメントの誤り対応を用いた歌ことばのコノテーション検出
利用词对齐误差对应关系进行歌曲词的内涵检测
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山元 啓史; ホドシチェク ボル; 陳旭東
  • 通讯作者:
    陳旭東
Development of datasets of the Hachidaishu and tools for the understanding of the characteristics and historical evolution of classical Japanese poetic vocabulary
开发《八大集》数据集和了解日本古典诗歌词汇特征和历史演变的工具
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bor Hodoscek; Yamamoto Hilofumi
  • 通讯作者:
    Yamamoto Hilofumi
Visualization of classical Japanese poetic vocabulary
日本古典诗歌词汇的可视化
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bor Hodoscek
  • 通讯作者:
    Bor Hodoscek
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

山元 啓史其他文献

二十一代集シソーラスのための漸近的語彙対応システムの開発
第二十一个同义词库的渐近词汇对应系统的开发
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山元 啓史; 村井源; ボル ホドシチェク
  • 通讯作者:
    ボル ホドシチェク
歌ことば「橘」「梅」「桜」における関連対の抽出
提取歌曲词“橘”、“梅”和“樱花”中的相关对
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山元 啓史; ホドシチェク ボル
  • 通讯作者:
    ホドシチェク ボル
二十一代集シソーラスのための漸近的語彙対応システムの開発
第二十一个同义词库的渐近词汇对应系统的开发
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山元 啓史; 村井源; ボル ホドシチェク
  • 通讯作者:
    ボル ホドシチェク

山元 啓史的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('山元 啓史', 18)}}的其他基金

Development of tools and datasets to analyze the characteristics of the historical evolution of Japanese classical poetic vocabulary
开发分析日本古典诗歌词汇历史演变特征的工具和数据集
  • 批准号:
    23K00545
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
外国人研究者のための科学技術日本語読解CAIの開発
科学技术的发展 面向外​​国研究人员的日语阅读理解CAI
  • 批准号:
    07858026
  • 财政年份:
    1995
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
Signaling効果を応用した日本語科学技術文献読解支援データベースの開発
利用信号效应开发支持日本科技文献阅读理解的数据库
  • 批准号:
    05858028
  • 财政年份:
    1993
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Development of tools and datasets to analyze the characteristics of the historical evolution of Japanese classical poetic vocabulary
开发分析日本古典诗歌词汇历史演变特征的工具和数据集
  • 批准号:
    23K00545
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Prince Tokiyasu's and Prince Tsuneyasu's salon; Research on expressions in Henjo's waka as a steppingstone
时安亲王和常安亲王的沙龙;
  • 批准号:
    19K13057
  • 财政年份:
    2019
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
A study on a educational history on languages in modern Okinawa
近代冲绳语言教育史研究
  • 批准号:
    15K04205
  • 财政年份:
    2015
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A development of thesaurus and fundamental study of description of longitudinal spacial chages of classical Japanese poetic vocabulary
日本古典诗词词库的发展与纵向空间变化描述的基础研究
  • 批准号:
    26370530
  • 财政年份:
    2014
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
心のデータベースとしての歌ことば -中世和歌における本歌取り意識の基盤と射程-
诗词作为心灵的数据库 - 中世纪和歌中honka-tori意识的基础和范围 -
  • 批准号:
    11J01022
  • 财政年份:
    2011
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了