人間の行動状況理解のための時空間の非線形圧縮による映像の情報要約機構
使用时空非线性压缩的视频信息摘要机制来理解人类行为情况
基本信息
- 批准号:11230205
- 负责人:
- 金额:$ 24.51万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas (B)
- 财政年份:1999
- 资助国家:日本
- 起止时间:1999 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本計画研究の目標は、講義を様々な観点から蓄積してアーカイブ化するシステムを構築することと、利用者自身がアーカイブの中から必要な部分を選択し、要約する枠組みを提案することである。様々な利用者の目的に応じることを可能とするために、講義アーカイブにはできるだけ多様な映像を記録しておくことが望ましい。そこで、受講者の動きを反映した活性度に基づく撮影と、話者位置を推定することによって、質問等をしている受講者の撮影を実現した。まず、受講者の活性度に応じた多様な映像を撮影するために、確率密度関数に基くカメラワークの決定手法を提案した。できるだけ多くの受講者を映像フレーム内に納めるため、位置的に近くに存在する受講者群を被写体の侯補とし、多数の被写体侯補に対して、受講者の動きに基づく活性度を割り当てた。そして、被写体候補を活性度に基いて順序付けたのち、撮影に利用できるカメラ台数に応じて等分し、それぞれのグループ内に含まれる被写体侯補を選択して撮影する確率を高めた確率密度関数を各カメラに対して割り当てることにより、ある時刻における受講者を、活性度に基き多様に撮影する手法を提案した。また、質問等をしている受講者の表情を撮影するために、講義室に複数設置した分散マイクシステムを用いた話者位置推定を実現した。二本のマイクからなるマイク対に到達する音の位相差を利用して音源方向を推定し、これを複数のマイク対に対して求めることによって、各音源方向の交点付近の領域に存在する話者位置を推定することが可能となった。さらに、利用者自身が視聴したい講義映像の被写体の数や撮影サイズなどの傾向を設定することにより、上記の手法によって撮影した複数の講義映像から、設定を満たすように自動選択して提示する枠組みについて検討した。
该研究项目的目标是建立一个从不同角度积累和存档讲座的系统,并提出一个用户可以从存档中选择和总结所需部分的框架。为了能够满足各种用户的目的,希望在讲座档案中记录尽可能多样化的视频。因此,我们能够根据学生的活动水平捕获反映学生动作的图像并估计说话者的位置,从而捕获学生提问的图像。首先,我们提出了一种基于概率密度函数确定相机工作的方法,以便根据学生的活动水平捕获各种视频。为了将尽可能多的学生放入视频帧中,我们使用一组位置接近的学生作为主题的候选者,并根据学生的动作为大量候选者分配激活度科目。根据候选对象的活动水平对候选对象进行排序后,根据可用于拍摄的摄像机数量将其分成相等的部分,并创建概率密度函数,以增加选择并拍摄候选对象中包含的候选对象的概率。我们提出了一种方法,根据学生的活动水平,在特定时间为每个学生拍摄不同的照片。此外,为了捕捉学生提问的面部表情,我们使用安装在多个教室的分布式麦克风系统实现了演讲者位置估计。通过使用到达由两个麦克风组成的麦克风对的声音的相位差来估计声源方向,并且针对多个麦克风对计算该相位差,可以通过使用到达由两个麦克风组成的声音之间的相位差来估计声源方向。麦克风对可以估计该人的位置。此外,通过设定用户自己想要观看的讲座视频的科目数和拍摄尺寸等趋势,从使用上述方法拍摄的多个讲座视频中自动选择并呈现符合设置的讲座视频的框架我们考虑过这个方法。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
河原達也: "A new phonetic tied-mixture model for efficient decoding"Proc. IEEE-ICASSP. 1269-1272 (2000)
Tatsuya Kawahara:“一种用于高效解码的新语音绑定混合模型”Proc。 IEEE-ICASP 1269-1272(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
河原達也: "音声認識結果の信頼度を用いた頑健な混合主導対話の実現法"情報処理学会研究報告. 2000-SLP-30-9. (2000)
Tatsuya Kawahara:“利用语音识别结果的可靠性实现稳健的混合主动对话的方法”日本信息处理学会研究报告 2000-SLP-30-9。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
美濃導彦: "Imaging a 3D Lecture Room by Interpreting Its Dynamic Situation"Proceedings of The Fourth International Workshop on the Cooperative Distributed Vision. 371-412 (2001)
Norihiko Mino:“通过解释其动态情况来想象 3D 演讲室”第四届合作分布式视觉国际研讨会论文集 371-412 (2001)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Takashi Matsuyama: "Active Image Capturing and Dynamic Scene Visualization by Cooperative Distributed Vision"Advanced Multimedia Content Processing (S. Nishio and F. Kishino eds.) Lecture Notes in Computer Science. No. 1554. 252-288 (1999)
Takashi Matsuyama:“协作分布式视觉的主动图像捕获和动态场景可视化”高级多媒体内容处理(S. Nishio 和 F. Kishino 编辑)计算机科学讲义。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
亀田能成: "複数のカメラを用いた複数ユーザに対する講義の実時間映像化法"電子情報通信学会論文誌. Vol.J82-D-II,No.10. 1598-1605 (1999)
Yoshinari Kameda:“使用多个摄像机的多个用户讲座的实时可视化方法”,电子信息和通信工程师协会学报,第 10 期。1598-1605(1999 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
美濃 導彦其他文献
環境メディア : コミュニケーション環境として機能する情報メディア-遠隔講義を具体例として-
环境媒体:起到沟通环境作用的信息媒体——以远程授课为例——
- DOI:
- 发表时间:
2003 - 期刊:
- 影响因子:0
- 作者:
美濃 導彦; 角所 考 - 通讯作者:
角所 考
質問応答・情報推薦機能を備えた音声による情報案内システム
具有问答和信息推荐功能的语音信息引导系统
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
翠 輝久;河原 達也;正司 哲朗;美濃 導彦 - 通讯作者:
美濃 導彦
美濃 導彦的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('美濃 導彦', 18)}}的其他基金
トップダウン情報を利用した拘束充足型画像処理
使用自顶向下信息的约束满足型图像处理
- 批准号:
04750324 - 财政年份:1992
- 资助金额:
$ 24.51万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
動的輪郭モデルに基づくトップダウン画像理解
基于动态轮廓模型的自上而下的图像理解
- 批准号:
03750279 - 财政年份:1991
- 资助金额:
$ 24.51万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
走行ロボットによる撮影画像を用いた画像生成AIによる建物屋内の損傷の自動検出
使用图像生成 AI 使用移动机器人捕获的图像自动检测建筑物内部的损坏
- 批准号:
24K07769 - 财政年份:2024
- 资助金额:
$ 24.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
損傷の位置情報と専門知を連携させた機械学習による橋梁撮影画像からの自動診断手法
结合损伤位置信息和专业知识的基于机器学习的桥梁图像自动诊断方法
- 批准号:
22KJ0947 - 财政年份:2023
- 资助金额:
$ 24.51万 - 项目类别:
Grant-in-Aid for JSPS Fellows
人為的撹乱に脆弱な種は,種特異的な生態系サービスを提供するか?死肉除去をモデルに
易受人为干扰的物种是否提供特定物种的生态系统服务?
- 批准号:
22KJ2830 - 财政年份:2023
- 资助金额:
$ 24.51万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Drone Photography and Image Object Detection by AI for Automatic Bird Counting
利用人工智能进行无人机摄影和图像对象检测以实现自动鸟类计数
- 批准号:
22K12465 - 财政年份:2022
- 资助金额:
$ 24.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Establishment of a method for monitoring wildlife populations: Collaboration of camera trapping, deep learning, and statistical modeling
建立野生动物种群监测方法:相机捕捉、深度学习和统计模型的协作
- 批准号:
21H03653 - 财政年份:2021
- 资助金额:
$ 24.51万 - 项目类别:
Grant-in-Aid for Scientific Research (B)