赞
踩
要求实现一个有关语音和文字两种模态融合的程序,同时阅读相关论文,根据个人理解撰写课程论文,并以ppt的形式进行讲解。可选为以下的五个主题
这里参考DCASE(Challenge on Detection and Classification of Acoustic Scenes and Events),即声学场景和事件检测及分类竞赛,是世界范围内权威的声学比赛,从2013年至今已经成功举办了六届,随着越来越多的顶级高校组织、权威科研机构等参与到比赛中来,DCASE在一定程度上推动了计算机听觉的发展的快速发展。
Task 2:First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring 用于机器监督的无监督异常声音检测
Task 3:Sound Event Localization and Detection Evaluated in Real Spatial Sound Scenes 基于真实空间声音场景的声音事件定位与检测
**Task 6 Automated Audio Captioning and Language-based Audio Retireval **:
**Task 7 Foley Sound Synthesis 仿真声音合成 **:
我是从事多模态方面的研究,所以想选一个多模态的方面的项目进行复现,并且与我而言,只需要复现一个baseline就行。在分析一下
暂时决定选最后一个,进行语音合成,然后尽快做自己的项目。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。