Study on embedding representations of financial entities based on price and texts

基于价格和文本的金融实体嵌入表示研究

基本信息

项目摘要

本研究の目的は、株銘柄など経済対象のベクトル表現を、数値データと非数値データから機械学習により獲得し、投資に寄与するデータ工学手法を探究することである。研究内容には、ベクトル表現に加え、それを入力する価格の系列モデルの二つがある。また、得られたベクトル表現は、ポートフォリオ、リスク評価、経済対象の関係マイニングなど、さまざまに応用が考えられる。本研究では、価格データの中でもコーパスが得やすい株、為替を対象とし、米国と日本のデータを利用して基礎研究を行う。二年目は、研究代表者はイギリスのケンブリッジ大学にて在外研究を行った。本研究に関し、言語処理の視点、経済データの視点から、連携の可能性が拓けた。特に、後者については、日本とは別の連携も進んでいることから、共同研究の可能性を今後探る。研究としては、二つの大きな成果が得られた。第一は、ポートフォリオ最適化について、当初の実証的な論文の理論的背景をまとめた論文を、トップジャーナルで発表したことである。ベクトル表現を一般化したヒルベルト空間を経済データ向けに提案し、その空間の持つ特性を数理的に明らかにした上で、実証的な成果を広く報告している。第二は、ベクトル表現手法そのものの研究である。全く新しい表現方式を、初年度最後に考案し、二年目に機械学習分野のトップ会議で発表した。通常の表現は、線形ベクトル空間における表現となっているが、本研究では、関数として対象を表現する。現在は、単語一般の表現となっているが、今後はこれを、経済対象の表現へと拡張する。この他、三年目以降に成果発表が持ち越されている事前研究を複数行った。リスク評価における自然言語の役割や、高リスクのイベント(fat tail)を鑑みた新しい系列モデルなどである。三年目以降に研究発表に繋げていく。
本研究的目的是通过机器学习从数值和非数值数据中获取股票品牌等经济对象的向量表示,并探索有助于投资的数据工程方法。除了向量表示之外,我们的研究还包括两种使用向量表示作为输入的价格序列模型。此外,所获得的向量表示可用于多种应用,包括投资组合、风险评估和经济对象的关系挖掘。在本研究中,我们将利用美国和日本的数据进行基础研究,重点关注价格数据中语料库容易获得的股票和汇率。第二年,主要研究者赴英国剑桥大学进行海外研究。关于这项研究,我们从语言处理和经济数据的角度开辟了合作的可能性。特别是后者,我们将探讨未来联合研究的可能性,与日本的其他合作也在取得进展。该研究取得了两项主要成果。首先,我们在顶级期刊上发表了一篇论文,总结了原始投资组合优化实证论文的理论背景。他提出了经济数据的希尔伯特空间(广义向量表示),从数学上阐明了该空间的特征,并广泛报道了实证结果。二是矢量表示方法本身的研究。他在第一年年底设计了一种全新的表示方法,并在第二年在机器学习领域的顶级会议上进行了展示。正常表达是在线性向量空间中,但在本研究中,对象被表达为函数。目前,它用于表达一般词语,但将来它将扩展到包括经济对象的表达。此外,我们还进行了几项初步研究,其结果延续到第三年及以后。其中包括自然语言在风险评估中的作用以及考虑高风险事件(厚尾)的新序列模型。这将从第三年开始进行研究报告。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Stock portfolio selection balancing variance and tail risk via stock vector representation acquired from price data and texts
通过从价格数据和文本获取的股票向量表示来平衡方差和尾部风险的股票投资组合选择
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xin Du;Kumiko Tanaka
  • 通讯作者:
    Kumiko Tanaka
Stock portfolio selection balancing variance and tail risk via stock vector representation acquired from price data and texts
通过从价格数据和文本获取的股票向量表示来平衡方差和尾部风险的股票投资组合选择
  • DOI:
    10.1016/j.knosys.2022.108917
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    8.8
  • 作者:
    Xin Du;Kumiko Tanaka
  • 通讯作者:
    Kumiko Tanaka
Semantic field of words represented as non-linear potental functions
表示为非线性势函数的单词语义场
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xin Du;Kumiko Tanaka
  • 通讯作者:
    Kumiko Tanaka
深層学習技術に基づく株ポートフォリオ配信サイト
基于深度学习技术的股票投资组合分发网站
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

石井 久美子其他文献

抗体や毒素を用いた糖脂質膜マイクロドメインの構造と機能解析について
使用抗体和毒素对糖脂膜微域进行结构和功能分析
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岩渕和久;玉木友樹;増田浩美;岩原知博;松本亮;中山仁志;小林俊秀;石井 久美子;早川智広;小川秀興;髙森建二
  • 通讯作者:
    髙森建二
N型遊離糖鎖の代謝におけるオートファジーの役割について
自噬在N型游离糖链代谢中的作用
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    清野 淳一;王 麗;石井 久美子;水島 昇;鈴木 匡
  • 通讯作者:
    鈴木 匡

石井 久美子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('石井 久美子', 18)}}的其他基金

少年雑誌にみる外来語の総合的研究
青少年杂志中外来词的综合研究
  • 批准号:
    21K13013
  • 财政年份:
    2021
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
冪則の観点からの高度技術の評価方法に関する研究
幂律视角下先进技术评价方法研究
  • 批准号:
    20K20492
  • 财政年份:
    2020
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Pioneering)
文書の自動難易度判定に関する研究
文档难度自动判定研究
  • 批准号:
    20650018
  • 财政年份:
    2008
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research

相似海外基金

動的に変わる集合に対する類似検索のスケッチを利用した高速化
使用动态变化集的草图加速相似性搜索
  • 批准号:
    21K11901
  • 财政年份:
    2021
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Price Discovery and Liquidity: The Impact of Public Information
价格发现和流动性:公共信息的影响
  • 批准号:
    19K01758
  • 财政年份:
    2019
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
The models for multi-way contingency tables and exact test using economic data
多路列联表模型及经济数据精确检验
  • 批准号:
    19K14600
  • 财政年份:
    2019
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Study on developing asset management with alternative data
利用另类数据开展资产管理研究
  • 批准号:
    19K23234
  • 财政年份:
    2019
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
A study on the empirical analysis of business fluctuations mechanism using big data
利用大数据的企业波动机制实证分析研究
  • 批准号:
    19K01583
  • 财政年份:
    2019
  • 资助金额:
    $ 10.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了