メタ情報に頼らない高被覆旅行記ジオロケーション技術の開発
开发不依赖元信息的高覆盖游记地理定位技术
基本信息
- 批准号:21K12137
- 负责人:
- 金额:$ 2.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
観光ビックデータを活用した包括的観光ニーズ調査の対象データとして観光旅行記SNSデータがあるが、これまでのところ、地理的位置情報の取得技術に関する技術的な整備の遅れにより、本調査への観光旅行記SNSデータの利活用は進んでいない。この状況を打開するため、本研究課題では、自然言語解析技術に立脚した2つの要素技術(地理的近接性を保持した埋め込み表現学習および地理的特定性を有するランドマーク抽出)を新たに開発することを通して、観光旅行記SNSの投稿内容から高精度に地理的位置を特定する技術(文書ジオロケーション技術、DG技術)を確立することを目的とする。2021年度は、地理的近接性を保持した埋め込み表現学習に関する手法の開発に着手し、良好な成果を得た。そこで、2022年度は主に、地理的特定性を有するランドマーク抽出に関する手法の開発に着手した。DG課題では地理的特定性を有するランドマークが重要な手がかりとなるが、現状において、単語の地理的特定性(ランドマーク性)の有無を判定する技術は整備されていない。そこで、本研究課題では、ある単語が文書内に現れた時にその単語が地理的位置を特定する程度をあらわす指標として地理的特定性指標を開発した。本指標は、地理的曖昧性および名称専有性の2つの要素から構成されている。地理的曖昧性はエンティティとそれをあらわす単語との対応関係に基づく指標であり、名称専有性はエンティティと単語との対応関係に関する人々の一般的な認知の度合いに基づく指標である。日本語Wikipedia データを知識源として、2つの指標値を推定したところ、直接評価では、ある程度人間の直感に沿う妥当な指標値を推定できていることを確認した。また、間接評価では、推定した指標値をDG課題の特徴量として取り込んだ比較実験を通して、指標値がDG課題の性能向上に寄与することを確認した。
旅游出行报告SNS数据是利用旅游大数据进行综合旅游需求调查的目标数据,但迄今为止,由于获取地理位置信息的技术发展滞后,还无法将旅游纳入本研究旅游杂志SNS数据的利用尚未取得进展。为了克服这种情况,本研究项目将开发基于自然语言分析技术的两项新的基本技术(保持地理邻近性的嵌入式表达学习和具有地理特异性的地标提取),从而建立技术(文档)。地理定位技术(DG技术),可以从SNS上的旅游杂志上发布的内容中高精度识别地理位置。 2021年,我们开始开发一种学习保持地理邻近性的嵌入式表示的方法,并取得了良好的效果。因此,在2022财年,我们主要开始开发一种提取地理特定地标的方法。具有地理特异性的地标是DG任务中的重要线索,但目前还没有技术可以确定一个词是否具有地理特异性(地标特征)。因此,在这个研究项目中,我们开发了一个地理特异性指数来表达一个单词出现在文档中时指定地理位置的程度。该指标由两个部分组成:地理模糊性和名称专有性。地理歧义是基于实体与代表该实体的词语之间对应关系的指标,而名称挪用则是基于人们对实体与词语之间对应关系的普遍认知程度的指标。当我们使用日语维基百科数据作为知识源估计两个指标值时,我们证实直接评估能够估计出合理的指标值,在一定程度上符合人类直觉。此外,在间接评估中,通过将估计指标值作为DG任务特征的对比实验,我们确认指标值有助于提高DG任务的性能。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
言及に対する地理的特定性指標の提案と文書ジオロケーションへの適用
提出提及的地理特异性指数并将其应用于文档地理定位
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:かげ山宗一; 乾孝司
- 通讯作者:乾孝司
A Neural Document Geolocation Model Using Geographical Knowledge Graph
使用地理知识图的神经文档地理定位模型
- DOI:10.20729/00222743
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:平川冬尉; 乾孝司
- 通讯作者:乾孝司
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
乾 孝司其他文献
乾 孝司的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('乾 孝司', 18)}}的其他基金
大規模電子化文書からの因果関係知識の自動獲得-接続標識に依存しない手法の検討-
从大规模电子文档中自动获取因果关系知识 - 不依赖于连接标记的方法的检验 -
- 批准号:
05J72904 - 财政年份:2005
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for JSPS Fellows