新通义实验室开源ThinkSound:用AI重塑”视听协同”的未来当我们观看一部电影或短视频时,总会发现某些画面缺乏与之匹配的声音——奔跑的马蹄声与尘土飞扬的镜头不同步,雨滴落在伞面的节奏与画面快慢脱节。这种"视听割裂"的现象背后,暴露出当前AI音频生成技术的瓶颈...AI新闻资讯# AudioCoT# CoT(Chain - of - Thought)# ThinkSound03640
新阿里通义开源首个音频生成模型 ThinkSound:让 AI 像专业音效师一样思考2025 年 7 月 4 日,阿里 “通义大模型” 公众号宣布,通义实验室首个音频生成模型 ThinkSound 正式开源。这款模型首次将 Chain-of-Thought(CoT,思维链)应用于音频...AI产品库# AudioCoT# Chain-of-Thought# ThinkSound05880