
近日,火山引擎正式發(fā)布“豆包.語音模型創(chuàng)業(yè)者加速計劃”,面向初創(chuàng)企業(yè)提供語音合成、聲音復(fù)刻和語音識別等大模型資源支持,入選企業(yè)可獲得3個月免費試用、價值4.7萬元的語音大模型服務(wù)。該計劃希望通過開放豆包語音大模型能力,加速AI語音相關(guān)新產(chǎn)品研發(fā),助力人工智能初創(chuàng)生態(tài)更加繁榮。目前火山引擎官網(wǎng)已開啟企業(yè)認(rèn)證申請入口。

3大語音模型能力,數(shù)千小時及千萬字支持
該計劃針對人數(shù)少于30人,以及將AI語音能力融入新產(chǎn)品研發(fā)并長期迭代的初創(chuàng)企業(yè)。具體而言,火山引擎通過API調(diào)用等方式開放豆包.聲音復(fù)刻模型、豆包.語音合成模型、豆包.語音識別模型等熱門能力,共計數(shù)千小時及千萬字支持。企業(yè)可登錄火山引擎官網(wǎng)申請,通過企業(yè)認(rèn)證之后填寫申請表,工作人員將在10個工作日進(jìn)行審核,并對審核通過的企業(yè)發(fā)放支持資源代金券。獲得代金券后3個月內(nèi),初創(chuàng)企業(yè)可通過火山引擎官網(wǎng)控制臺及接口文檔接入豆包語音大模型能力,兌換免費額度,用于AI語音相關(guān)應(yīng)用或產(chǎn)品的研發(fā)。
AI語音場景加速,助力良性生態(tài)發(fā)展
調(diào)研顯示,在發(fā)展“人工智能+”的大背景下,出于技術(shù)門檻和資金投入等因素,中小初創(chuàng)企業(yè)亟需更加廣泛深入的基礎(chǔ)設(shè)施和平臺支撐。
豆包語音大模型致力于多個語音場景的深耕,聚焦陪伴式AI交互、沉浸式聽書、跨語種內(nèi)容生產(chǎn)、企業(yè)客戶服務(wù)等場景,為企業(yè)級客戶提供豐富的語音能力:
豆包.語音合成模型:根據(jù)上下文智能預(yù)測文本的情緒、語調(diào)等信息,并生成超自然、高保真、個性化的語音,以滿足不同用戶的個性化需求。
豆包.聲音復(fù)刻模型:全新自研語音大模型算法打造的高效化的輕量級音色定制方案。僅需只需5秒數(shù)據(jù),即可完成對用戶音色、說話風(fēng)格、口音和聲學(xué)環(huán)境音的復(fù)刻,并進(jìn)行跨語種遷移。
豆包.語音識別模型:擁有更加靈敏的耳朵+更加聰明的大腦,通過上下文感知功能進(jìn)行推理,識別效果更加精準(zhǔn),同時支持上海話、閩南語等多種方言識別。
目前,火山引擎豆包語音大模型能力已在豆包APP、剪映、抖音、番茄小說等多款內(nèi)部產(chǎn)品展開應(yīng)用,并逐漸向企業(yè)開放以拓展更多AI語音應(yīng)用場景。大模型技術(shù)不斷演進(jìn)成熟,推動人工智能向產(chǎn)業(yè)滲透,而初創(chuàng)企業(yè)正是應(yīng)用創(chuàng)新的重要前線。火山引擎將持續(xù)推動字節(jié)跳動AI能力外溢,以成熟的大模型和平臺工具,以及廣泛的生態(tài)支持,助力廣大初創(chuàng)企業(yè)成長,實現(xiàn)人工智能時代的共同繁榮。
