欢迎来到人工智能的国际,这里是科技的前沿,立异与构思的结合。当咱们谈论数字永生时,最令人振奋的就是将自己的声响和灵魂永久保留在虚拟国际。我忽然意识到,咱们每天都在与手机进行无数次的互动,而其中最私密、最实在的一部分,就是咱们的语音信息。这不只包含咱们在电话中的谈话,还有咱们在各种交际运用中发送的语音音讯。这些都是最实在、最直接的自我表达,也是最能展现咱们个性的一部分。而且,这些信息都被保存在咱们的手机中,成为了一个巨大的、有关咱们自己的数据库。

语音克隆实验:提取微信聊天记录训练自我的声音模型

所以,我开端思考:假如我能从这些数据中提取出有用的信息,然后用这些信息来练习一个语音克隆模型,那么我就能创建出一个能够仿照我自己的声响的AI。这不只是一种全新的自我表达方式,也许还能成为数字永生的一种或许。在这篇博客文章中,我将与大家共享如何从微信语音音讯中提取声响,用于练习一个自我的声响克隆模型,以迈出数字永生的第一步。

一、预备工作

语音克隆实验:提取微信聊天记录训练自我的声音模型
为了完成这个项目,我将需求以下几个进程:

  1. 从微信中提取语音音讯:我运用了WechatExporter和iOS设备来完结这个进程。WechatExporter是一个开源的微信导出东西,能够协助咱们将微信中的聊天记载导出并保存为文本或HTML格局。这个东西非常有用,由于它能够协助咱们保存微信中的一切聊天记载,包含文字、图片、语音、视频等。

  2. 清洗和处理语音数据:在这个进程中,我运用了chatGPT4和python来清洗和处理语音数据。这些东西能够协助我将语音数据转化为能够被模型了解的格局。

  3. 运用UVR5去除布景噪音:UVR5是一款音频处理东西,它能够协助咱们去除音频中的布景噪音,进步音频的清晰度。在这个项目中,我运用UVR5处理了我从微信中导出的语音音讯,去除了布景噪音,使得语音更加清晰。

  4. 将语音数据输入声响克隆模型进行练习:在收集了满足的练习数据后,我运用了SO-VITS-SVC来练习我的声响克隆模型。这是一个声响克隆模型,能够协助咱们练习一个能够仿照咱们自己声响的AI。我运用了这个模型,经过很多的练习数据,练习出了一个能够仿照我自己声响的AI。这个模型的练习进程需求很多的计算资源,为此我租用了一台GPU A100(40G RAM)的机器进行练习。

二、从微信提取语音音讯

语音克隆实验:提取微信聊天记录训练自我的声音模型
作为咱们日子中不可或缺的一部分,手机现已成为了最了解咱们的伙伴。微信作为重要的通讯东西,其中包含了很多与亲朋好友的聊天记载。为了提取这些有价值的语音数据,我首先需求将微信中的语音音讯导出,并进行挑选。这个进程花费了我一整周的时刻,翻阅很多的聊天记载,也让我回顾了很多有趣的往事。

三、清洗和处理语音数据

语音克隆实验:提取微信聊天记录训练自我的声音模型
接下来,我运用UVR5将配乐和人声分离,同时去除了布景噪音。为了练习模型,我需求将音频切割成5秒到10秒的片段,因而我运用了Audio Slicer进行音频切分。

四、练习声响克隆模型

语音克隆实验:提取微信聊天记录训练自我的声音模型
在收集了满足的练习数据后,我租用了一台GPU A100(40G RAM)的机器进行练习。经过10个小时的练习,我得到了一个29600 epoch的模型。接下来,我尝试用这个模型来推理声响。我选取了林奕匡《高山低谷》的27秒片段和郑中基《无赖》的34秒片段进行测验。

五、推理和成果展现

将推理后的声响与原有配乐结合,我得到了以下的成果。

后续我还会将这些清洗后的微信文字记载语音转文字记载投喂到大型言语模型,尝试炼制专属于我自己的虚拟帮手。将来,这个虚拟帮手将能够仿照我的声响和言语风格,乃至能够在我不在的时候替代我和人交流。

语音克隆实验:提取微信聊天记录训练自我的声音模型

六、后续或许的应战与开展

尽管我现已成功地克隆了我的声响,而且预备拥有一个能够仿照我言语风格的虚拟帮手,但这个项目依然面临着很多应战。例如,虚拟帮手是否能够了解和处理复杂的人际交往问题?它能否在没有明确指令的情况下自我学习和生长?这些都是我在未来需求深入研究的问题。

语音克隆实验:提取微信聊天记录训练自我的声音模型

但是,我深信一点,那就是人工智能的开展将会给咱们带来史无前例的或许性。咱们能够经过它完成数字永生,能够利用它来进步咱们的日子质量,但也会面临许多社会问题,乃至推翻千万年来,一步一步建立的人类主导的位置。

写在最终

我期望这篇文章能够启发更多的人开端探究人工智能的或许性。假如你觉得这篇文章有协助,欢迎关注我,也欢迎共享给你的朋友。让咱们一起在人工智能的国际里探究不知道,完成咱们的愿望。

感谢你的阅览,咱们下次再会!

这篇文章是我自己的一次尝试和探究,假如你有任何建议或问题,欢迎留言。我会尽我所能回答你的问题,而且我也期待听到你的声响。