在感官能力層面,系統構建了“形、聽、思、說”四維一體的技術架構:通過 3D modeling、Maya 和 CG 實現場景建模;運用 ASR、OCR 和OCC 技術處理語音和圖像識別;借助 NLP、DM、KB 和 IS 實現智能語義理解;配合 TTS 和 STA 技術完成語音交互。該等技術能力以算力平臺和 AI 平臺作為基礎支撐,通過統一的納管服務、AI 模型和訓練平臺,打造了一個完整的業務數字人解決方案。
在感官能力層面,系統構建了“形、聽、思、說”四維一體的技術架構:通過 3D modeling、Maya 和 CG 實現場景建模;運用 ASR、OCR 和OCC 技術處理語音和圖像識別;借助 NLP、DM、KB 和 IS 實現智能語義理解;配合 TTS 和 STA 技術完成語音交互。該等技術能力以算力平臺和 AI 平臺作為基礎支撐,通過統一的納管服務、AI 模型和訓練平臺,打造了一個完整的業務數字人解決方案。