【本報訊】OpenAI正式官宣升級即時API介面,一次性推出三款全新高階語音智慧模型,全面強化AI即時聽覺、口語交互、翻譯與轉錄能力,大幅降低企業開發智慧語音應用的技術門檻。

本次更新核心產品包含GPT-Realtime-2、即時翻譯模型與即時轉寫模型。其中GPT-Realtime-2搭載GPT-5級別的推理能力,人聲模擬度更高,相較於前代產品,可精准理解並處理複雜人類指令,實現更自然、更智慧的連續對話交互。

翻譯方面,GPT-Realtime-Translate支援70餘種語言識別、13種語言語音輸出,可同步人聲語速完成即時翻譯,實現無卡頓跨語言溝通。配套上線的Whisper即時轉錄模型,能夠在人機互動過程中同步完成語音轉文字,適配會議記錄、即時筆錄等高頻辦公場景。

OpenAI表示,本次升級將AI音訊交互從基礎問答升級為綜合性智慧語音作業系統,集聆聽、思考、翻譯、轉寫、即時回應於一體,實用性大幅提升。行業應用場景覆蓋智慧客服、線上教育、媒體直播、大型國際活動以及創作者平臺,商業化落地空間廣闊。【編輯:陸語】

編輯出版發行人:環球新聞時訊報
社長:魏月童
承印:環球電視有限公司
地址:香港上環幹諾道西20號中英大廈141401