|
关注:1
2013-05-23 12:21
求翻译:We also built a set of tools for identifying the speakers appearing in this archive. The diarize-jruby library,4 itself built on top of the LIUM SpeakerDiarization toolkit [6], splits up programmes and trains a model for each voice found. However identifying speakers across programmes is hard to scale to large archive是什么意思?![]() ![]() We also built a set of tools for identifying the speakers appearing in this archive. The diarize-jruby library,4 itself built on top of the LIUM SpeakerDiarization toolkit [6], splits up programmes and trains a model for each voice found. However identifying speakers across programmes is hard to scale to large archive
问题补充: |
|
2013-05-23 12:21:38
我们还建立了一套工具,用于识别出现在此存档扬声器。
|
|
2013-05-23 12:23:18
我们还构建了一套工具,可用于确定扬声器出现在该归档文件。 “diarize的JRuby库、4上构建自己的lium speakerdiarization工具包[6],拆分方案和列车模型找到的每个语音。 但是在方案确定扬声器是很难进行扩展以满足大型档案馆,作为模型有一个大的维数,我们有一个很大的数(每个扬声器0每个程序,它相当于几百万的整个档案。)。
|
|
2013-05-23 12:24:58
我们在这个档案也打制了一套为辨认报告人的工具出现。 diarize-jruby图书馆, 4本身建造在LIUM SpeakerDiarization工具箱 (6顶部),分离了节目并且训练一个模型为被发现的每声音。 然而辨认演讲人横跨节目是坚硬称对大档案,因为模型有很大数量维度和我们有很大数量他们 (一个每位报告人每个节目,共计到几百万为整个档案)。 因此我们在我们的红宝石lsh5图书馆建立了根据现场敏感 (哈希) LSH (技术)的索引7,如被实施,执行快速的近邻居查寻。 当询问与种子报告人模型时,这个索引将退回也许对应于同一个人,可以使用很大地减少比较的数量需要使这些模型成群的候选人报告人一张
|
|
2013-05-23 12:26:38
我们还建立了一套工具,用于识别该存档文件中出现的扬声器。Diarize jruby 图书馆,4 本身建立在黄萎 SpeakerDiarization 工具包 [6],拆分方案和培训为发现的每个声音的模型。然而跨方案确定发言者很难扩展到大的档案,如模型有大量的尺寸,我们有大量的他们 (每位发言每个方案,这等于为整个档案的几个万人)。我们因此在我们红宝石 lsh5 库,执行快速最近邻搜索建基于局部性敏感哈希 (LSH) 技术 [7],作为实施指标。当查询与种子说话人模型,此索引将返回可能对应的候选人发言相当小名单到相同的人,可以用来大大减少群集这些模型时需要比较的次数。我们通过将它应用于整个档案证
|
|
2013-05-23 12:28:18
正在翻译,请等待...
|
湖北省互联网违法和不良信息举报平台 | 网上有害信息举报专区 | 电信诈骗举报专区 | 涉历史虚无主义有害信息举报专区 | 涉企侵权举报专区