導(dǎo)語(yǔ)
7月26日,備受矚目的2025世界人工智能大會(huì)(WAIC)在上海盛大啟幕,清聽(tīng)聲學(xué)攜前沿技術(shù)聚音屏驚艷亮相,以定向發(fā)聲與定向拾音的核心技術(shù),展現(xiàn)新型音頻技術(shù)賦能人工智能與具身智能的創(chuàng)新成果。聚音屏刷新人機(jī)交互形式,為下一代智能終端打開(kāi)全新交互維度,精準(zhǔn)契合AI與具身智能發(fā)展趨勢(shì),成為AIGC領(lǐng)域的重要推動(dòng)者。
作為全球人工智能領(lǐng)域規(guī)格最高、規(guī)模最大、影響力最廣的頂級(jí)盛會(huì),本屆WAIC吸引來(lái)自全球50多個(gè)國(guó)家和地區(qū)的頂尖學(xué)者、行業(yè)領(lǐng)袖及創(chuàng)新企業(yè)。在大會(huì)的“未來(lái)AI會(huì)客廳”展區(qū),聯(lián)想創(chuàng)投攜手多家被投企業(yè)共同描繪了一幅AI賦能下的未來(lái)圖景,而“聚音屏”無(wú)疑是其中最引人注目的技術(shù)之一。
聚音屏精準(zhǔn)控制聲音傳播方向,讓用戶在開(kāi)放環(huán)境中享受私密、清晰的聽(tīng)覺(jué)體驗(yàn),無(wú)需佩戴耳機(jī)即可實(shí)現(xiàn)“聲音的私人定制”。結(jié)合定向拾音技術(shù),還能智能過(guò)濾環(huán)境干擾噪聲,精準(zhǔn)捕捉目標(biāo)聲音,提高語(yǔ)音識(shí)別準(zhǔn)確率和沉浸感,不僅提升AIGC內(nèi)容生成的質(zhì)量,還為智能助手、虛擬數(shù)字人、沉浸式游戲等場(chǎng)景注入更自然、更高效的交互方式,助力AIGC生態(tài)全面繁榮。
賦能AIGC
打造沉浸式、個(gè)性化內(nèi)容體驗(yàn)新范式
傳統(tǒng)嘈雜環(huán)境是AIGC語(yǔ)音交互與具身智能感知的主要桎梏,而用戶對(duì)音頻體驗(yàn)沉浸感和個(gè)性化的更高要求,更是AIGC成功落地的關(guān)鍵。清聽(tīng)聲學(xué)以聲學(xué)黑科技破局,提供完美解決方案。
想象一下,在未來(lái)的家庭娛樂(lè)中心,一位用戶正與AIGC生成的虛擬偶像進(jìn)行實(shí)時(shí)互動(dòng)。借助聚音屏,虛擬偶像的聲音可直接、清晰地傳遞給這位用戶,同時(shí)不會(huì)打擾到正在客廳另一側(cè)閱讀的家人。這種專屬的、私密的聽(tīng)覺(jué)通道,極大地增強(qiáng)了人機(jī)交互的沉浸感和真實(shí)感。
在服務(wù)臺(tái)、接待處、問(wèn)詢處等公共空間,AIGC結(jié)合“聚音屏”的應(yīng)用將為參觀者帶來(lái)顛覆性的體驗(yàn)。當(dāng)用戶來(lái)到問(wèn)詢臺(tái),AIGC能精準(zhǔn)識(shí)別并拾取用戶咨詢的問(wèn)題,自動(dòng)生成回復(fù)內(nèi)容,并將回復(fù)聲定向投送給這位用戶,實(shí)現(xiàn)“一人一導(dǎo)覽”的個(gè)性化服務(wù),徹底改變公共信息獲取的方式。
顛覆性人機(jī)聽(tīng)覺(jué)體驗(yàn)
從“聽(tīng)到”到“聽(tīng)懂”的聲學(xué)革命
在AIGC驅(qū)動(dòng)的智能化浪潮中,人機(jī)交互界面的創(chuàng)新至關(guān)重要。聚音屏重新定義人機(jī)聽(tīng)覺(jué)感知和交互,無(wú)論是智能客服、數(shù)智講解員、虛擬主播,還是教育、醫(yī)療、金融等行業(yè)的AI應(yīng)用場(chǎng)景,都能顯著提升交互效率與用戶滿意度。
在復(fù)雜的現(xiàn)實(shí)環(huán)境中,精準(zhǔn)理解人類,對(duì)機(jī)器人來(lái)說(shuō)是一個(gè)巨大挑戰(zhàn),傳統(tǒng)的拾音系統(tǒng)會(huì)拾取來(lái)自四面八方的聲音,而搭載聚音屏的定向拾音技術(shù),則可以像“聲音的聚光燈”一樣,精確捕捉來(lái)自特定方向的聲音,有效過(guò)濾掉周圍環(huán)境的噪音。
例如,在嘈雜的大廳環(huán)境中,用戶可以通過(guò)簡(jiǎn)單的語(yǔ)音指令,精確地控制機(jī)器人。機(jī)器人搭載的“聚音屏”系統(tǒng)能夠精準(zhǔn)地“聽(tīng)”到用戶指令,而忽略掉嘈雜的環(huán)境噪聲和其他語(yǔ)音干擾,這種沉浸式、個(gè)性化的聽(tīng)覺(jué)體驗(yàn),不僅滿足了AIGC對(duì)高質(zhì)量?jī)?nèi)容生成的需求,也為具身智能設(shè)備賦予了更人性化的交互能力。
2025年被業(yè)界視為具身智能與AIGC技術(shù)融合的關(guān)鍵年份,清聽(tīng)聲學(xué)通過(guò)“定向音頻”破解音頻交互難題,以其前瞻性的技術(shù)布局,正站在這一浪潮的前沿。作為聯(lián)想集團(tuán)的戰(zhàn)略生態(tài)合作伙伴,聚音屏將繼續(xù)深耕定向音頻技術(shù),探索更多AIGC應(yīng)用場(chǎng)景,如智能家居、自動(dòng)駕駛、虛擬現(xiàn)實(shí)(VR/AR)等,為用戶帶來(lái)更智能、更個(gè)性化的交互體驗(yàn)。同時(shí),聚音屏致力于與全球AI生態(tài)伙伴合作,共同推動(dòng)人工智能技術(shù)的普惠化與產(chǎn)業(yè)化發(fā)展。
此次亮相WAIC 2025,不僅展示中國(guó)聲學(xué)技術(shù)的創(chuàng)新實(shí)力,也為推動(dòng)AIGC與具身智能的落地應(yīng)用提供了“聽(tīng)得見(jiàn)”的解決方案,展現(xiàn)了與AIGC、具身智能融合的無(wú)限可能。在“同球共濟(jì)”的時(shí)代愿景下,清聽(tīng)聲學(xué)正以創(chuàng)新之聲,書寫AIGC時(shí)代新的篇章。