1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        直播線上實(shí)時(shí)翻譯和流式字幕技術(shù)實(shí)踐與應(yīng)用

        共 1254字,需瀏覽 3分鐘

         ·

        2021-12-11 19:43

        直播線上實(shí)時(shí)翻譯和流式字幕技術(shù),區(qū)別于傳統(tǒng)的線下翻譯+字幕疊加硬件設(shè)備,創(chuàng)新性的采用云線上實(shí)時(shí)翻譯+流式字幕疊加,通過API的方式實(shí)現(xiàn)直播視音頻分離、音頻轉(zhuǎn)碼、語音識(shí)別及轉(zhuǎn)文本、文本翻譯、自動(dòng)審核、字幕返回等功能,并最終將流式字幕疊加到直播源流中,語音識(shí)別、轉(zhuǎn)寫及翻譯準(zhǔn)確率預(yù)計(jì)可達(dá)90%以上,并擁有自動(dòng)校正功能,在保證字幕效果的情況下,極大的節(jié)省了使用成本,且系統(tǒng)支持動(dòng)態(tài)擴(kuò)縮容,便捷高效。


        技術(shù)實(shí)現(xiàn)原理是將直播流進(jìn)行音頻流剝離,利用AI語音能力將直播流中的音頻流進(jìn)行實(shí)時(shí)識(shí)別、轉(zhuǎn)寫,同時(shí)進(jìn)行多語言翻譯及內(nèi)容審核,過濾敏感內(nèi)容,保障內(nèi)容的安全合規(guī),最終將識(shí)別的原語言和翻譯語言以實(shí)時(shí)字幕的方式疊加到直播流中,讓用戶可以在觀看直播畫面、聲音的同時(shí)可以獲取文字維度的信息,極大的提升用戶的觀看體驗(yàn)。


        技術(shù)方案架構(gòu)圖


        模塊組成:


        業(yè)務(wù)實(shí)現(xiàn)流程:

        ??業(yè)務(wù)層對(duì)接視頻云PaaS平臺(tái),開啟功能并配置翻譯模板;
        ??現(xiàn)場推流到CDN邊緣節(jié)點(diǎn);
        ??CDN轉(zhuǎn)推到視頻云PaaS平臺(tái);
        ??視頻云PaaS平臺(tái)進(jìn)行直播流調(diào)度及轉(zhuǎn)發(fā)、音頻流剝離并發(fā)送給AI語音服務(wù)平臺(tái);
        ??視頻云PaaS平臺(tái)獲取轉(zhuǎn)寫及翻譯音頻流接收,并進(jìn)行音視頻流合并;
        ??將合成字幕后的視頻云流進(jìn)行轉(zhuǎn)碼、源流及含字幕流切片、錄制等,支持時(shí)移回看、錄制文件回放等,然后將含字幕的直播流轉(zhuǎn)推給CDN;
        ??終端平臺(tái)播放器從CDN獲取轉(zhuǎn)碼流播放。


        技術(shù)優(yōu)勢:

        ●?分析語音數(shù)據(jù)的處理速度,拿到字幕數(shù)據(jù)的延遲,在輸入層對(duì)視頻數(shù)據(jù)進(jìn)行延遲控制,最終可以控制在1s以內(nèi),實(shí)現(xiàn)直播聲音、畫面、字幕完美同步的良好體驗(yàn);
        字幕模板動(dòng)態(tài)靈活配置,支持自定義位置、字體大小、顏色、背景色等;
        支持靈活配置開啟或關(guān)閉字幕:比如中場休息、播放宣傳片或者其他廣告內(nèi)容時(shí),可以關(guān)閉字幕;
        ●?區(qū)別于傳統(tǒng)的線下翻譯+字幕疊加硬件設(shè)備,創(chuàng)新性的云線上實(shí)時(shí)翻譯+字幕疊加,通過API的方式實(shí)現(xiàn)全部流程,且只支持的并發(fā)路數(shù)可以動(dòng)態(tài)擴(kuò)縮容,提升使用和運(yùn)維效率;另外相比傳統(tǒng)的線下實(shí)現(xiàn)方式,綜合降本預(yù)計(jì)高達(dá)95%以上。

        實(shí)踐過程中遇到的難點(diǎn):

        ? 聽寫以及翻譯的準(zhǔn)確性,需要根據(jù)不同的場景進(jìn)行定制訓(xùn)練;
        ? 聲音、畫面、字幕的同步控制。

        技術(shù)應(yīng)用場景:

        該技術(shù)可以廣泛的應(yīng)用于電商、會(huì)展、融媒、教育等領(lǐng)域,比如在電商領(lǐng)域,可以幫助企業(yè)聚焦直播帶貨出海業(yè)務(wù)場景,通過云端實(shí)時(shí)翻譯+多語言字幕的技術(shù)手段,降低海外地區(qū)用戶的觀看門檻,提升直播觀看量,從而提升商品購買轉(zhuǎn)化率和GMV;在會(huì)展行業(yè),可以完美替代同傳和線下硬件設(shè)備,大大降低會(huì)展直播成本。


        技術(shù)實(shí)踐:

        該技術(shù)在2021年相繼應(yīng)用于服貿(mào)會(huì)、亞歐商品貿(mào)易博覽會(huì)、商洽會(huì)等國際性展會(huì)項(xiàng)目中,具體效果通過下面的視頻來展示:



        瀏覽 115
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            国产做爱免费视频 | 亚洲精品无圣光 | 好大好紧h亲女 | 91香蕉国产视频 | A片在线观看网站 | 97色色大香蕉 | AV操操操 | 曰本性生活片 | 国产一级婬片A片AAA樱花 | 一级黄片学生妹 |