iphone怎么提取声音到本地
发布:小编
史蒂芬·霍金的「机械电音」,也许是世界上其中一个最有辨识度的声音。
但那并不是霍金自己的声音。
在霍金因渐冻症(ALS)失去说话能力的年代,技术还不足以让他能生成自己声音。事实上,能用上语音合成器的人都屈指可数。
到了今天,ALS 患者虽然有了更多语音合成的选择,但总体费用和时间门槛仍然不低,普及度也有限。
最近,苹果公布了全新无障碍功能 Personal Voice(暂未上线),不仅让用户能免费「备份」自己的声音,同时还在安全地应用 AI 技术上,作出了一次有意思的尝试。
只需 15 分钟「调教」,就能生成你的声音
▲ 图自 Fastcompany
在生成式 AI 可以模仿一切的时代里,用 AI 模仿一个人的声音听起来已经不算新奇,只是感觉有点安全隐患。
我好奇的,更多是苹果要怎样安全和高效地实现 Personal Voice 这一功能。
据介绍,iPhone、iPad 和 Mac 用户只需要根据提示录制 15 分钟的音频,苹果就会基于设备端的机器学习技术来生成和用户一样的声音。
相比之下,为失语群体提供专业语音合成服务的公司,可能需要采用专业设备,录制几小时的语音素材,价格最低都要数百美元。
另一项新无障碍功能 Live Speech,则支持用户打电话、FaceTime 或者是和他人面对面对话的时候,输入文字即可生成语音内容,为失语或不方便说话的用户提供另一种「发声」方式。
结合 Personal Voice 和 Live Speech 两项功能,失语用户就能用接近自己原本声音的生成声音和他人沟通。
用起来是方便了,但怎样避免有人用网上扒的语音素材来生成他人的声音?
- 素材随机化。
在录制 15 分钟语音素材的过程中,苹果将随机生成需要用户朗读的内容,减少他人猜中素材的可能性。
- 物理距离屏障。
在录制过程中,用户需要在距离设备 6-10 英寸(约 15- 25 厘米)的特定空间里完成录制。
在生成过程中,所有数据都将通过苹果的 Neural Engine(神经引擎)在设备本地完成,不必要上传到云处理。
语音合成后,第三方应用如果想使用 Personal Voice,都要获得用户明确授权。
即便第三方应用获得授权使用时,苹果也会采用额外的背景保护,确保第三方应用无法获取 Personal Voice 以及用户之前所录制的语音素材。
如果是苹果「全家桶」用户,生成自己的 Personal Voice 后还能通过 iCloud 同步到不同设备上,并以端对端的方式加密。
自己的声音,失去了才懂多重要
人是感性的生物,而声音是很强烈的情感触发器。
有研究指出,当人在听到母亲的声音时,身体释放出催产素水平和跟妈妈拥抱时产生的程度很相似。另一个研究则指出,听到自己的声音,会增强一个人的自我能动性。
这听起来有点抽象。
但当我们失去它时,重要性就变得显而易见了。
2021 年 3 月,Ruth Brunton 被确诊 ALS。那年圣诞,她就已经失语了。
ALS 患者中,约有 25% 的人患的是「延髓起病型」肌萎缩侧索硬化症,主要表现是说话障碍或吞咽困难。这类病人说话会逐渐变得含糊、带有鼻音,甚至失语。
Brunton 的行动很果断,确诊后马上找公司去做语音生成。
来回花了一个月时间,录了 3000 多个句子的语料,但最后出来的结果并不理想。
那家公司用的是一种名为「单元选择(unit selection)」技术。
简单粗暴来说,它就是通过「拼接」来实现语音生成,把语料拆分为大量小的语音单元,然后按需把元素拼起来。
▲单元选择技术下,「Bob」这一词语能被拆分成不同语音元素,图自《华盛顿邮报》
这种技术生成的语音能听清,但会有点电音,听起来不太自然。
结果就是,Brunton 录制的语料结合了微软一个名为「Heather」的声音,不但声音和自己毫不相似,甚至逼着这英国人「讲」起了美语口音。
困在这个声音里,Brunton「只会在必要的时候说话,不再是因为想说话而说话」。
从前和丈夫打闹聊天的心情消失了,Brunton 也不怎么愿意参加多人对话。
即便是说「我爱你」,用一个不像自己的声音来说,意义也似乎被削弱了。
六个月后, Brunton 和丈夫争取回了最初录制的语音素材,找了另一家公司,用 AI 技术合成了一个更像她自己的声音:
这听起来也许有点傻,但重新获得自己的声音让我更有自信了。
在波士顿儿童医院负责「增强沟通」项目的 John M. Costello 留意到,那些采用了更真实生成语音的病人,似乎更能够和亲近的人建立深厚的联结。
2022 年圣诞节,「重获新声」的 Brunton 还用语音录制的一段节日祝语。
然而,圣诞刚过,Brunton 就染上了新冠,最后在今年 2 月离世了。
她离开的那晚,丈夫 David 一整夜都握着她的手:
我们有两年时间来告别。
我们说好了,我们要说尽一切我们想说的。
难以想象,如果 Brunton 后来没换上更像自己的声音,她又是否能自在地说出想说的一切。
无障碍思维点亮灵感,AI 燃起生产力
我一直认为,无障碍设计所挖掘的,其实就是人类多样性创造的想象力资源。
我们去到和自己有着截然不同生活体验的人面前,聆听更少被诉说的故事和体验,创造出我们之前没想象过,但却能对更多人友好的的新生活方式。
Personal Voice 能让失语的 ALS 患者重新获得自己的声音;也可以帮助在经历「刀片嗓」的我用自己的声音去和其他人对话;甚至,我也很难避免会去想象,是否应该用这为自己「备份」声音留给亲近的人,以免哪天自己会突然离世。
而 AI 技术,就是实现这些想象力生产力。
正如杜编辑之前说的,虽然不赶生成式 AI 的热闹,但苹果一直都把 AI 用来提升用户体验 —— 提升效率,保护隐私。
提升效率,在于提升本地执行的机器学习算法和模型。
除了 Personal Voice 以外,苹果这次预览的另一个无障碍功能 Point and Speak 也采用了本地设备端的机器学习技术。
未来,视障用户在 iPhone 自带的放大器里,结合 Point and Speak 和旁白功能,就能凭自己手指把 iPhone 变成「点读机」 —— 点到哪儿,让 iPhone 给你把文字读到哪儿。
去年的「门检测」功能道理也类似,让设备端的机器学习帮视障用户识别出门,并朗读出门上面的信息和周围的标识。
至于隐私,按乔布斯说的,就是「如果你需要他们(用户)的数据,那就向他们(用户)请求。每一次都如此。」
这在无障碍设计方面也尤其重要 —— 因为这些功能设计起源就是服务被所谓「常规设计」忽略的人,常常都是更弱势的群体,因此更有必要确保这些用户的隐私不受侵害。
在这个语境下,我们也可开启更多关于数据应用权和透明度的讨论。
苹果这次做 Personal Voice 时,和帮助 ALS 患者的非盈利机构 Team Gleason Foundation 合作。
▲ Team Gleason Foundation CEO Blair Casey(右)
该机构的 CEO Blair Casey 一直也在推动语音生成公司设定一套标准录制素材设定,让用户能直接录这部分素材,并体验不同公司生成出来的语音效果,而不是像现在一样「盲赌」。
同时,Casey 也主张语音生成公司把用户录制的语音素材数据提供给用户(因为很多用户可能录制后就失语了),以免他们未来想把这些数据用在其他技术上:
如果更好的技术出来了,你会不想试一试吗?
如果你没法拿回自己的语音素材,你就没法去试。
AI 也许是我们时代最强的生产力。
但是,这力该怎么使,也许以人为本的无障碍设计能给它不少指引。
版权声明:本文来自用户投稿,不代表【百发生活】立场,本平台所发表的文章、图片属于原权利人所有,因客观原因,或会存在不当使用的情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系(邮箱:)我们将及时处理,共同维护良好的网络创作环境。
大家都在看
-
iphone 相机操作指南,iphone 13相机怎么调拍照最好
数码极客前 言一般来说,一本书的前言都是废话比较多一些,所以这本书也不例外。但是我还是想要和大家分享一下关于这本 iPhone 相机操作指南的故事,它可能并不能帮助你用 iPhone 拍好照片,但我希望可以让你感受到我们自己本身对这件事的热爱。Shot on iPhone 6如你看到,这
-
iphone 11promax屏幕尺寸大小
数码极客iphone 11promax屏幕尺寸大小 1、iPhone 11 Pro Max采用6.5英寸全面屏,长度为158毫米,宽度为77.8毫米,高度为8.1毫米,提供“金色”、“深空灰色”、“银色”、“暗夜绿色
-
iphone 12 mini尺寸
数码极客iphone 12 mini尺寸 1、iphone12mini整体的屏幕尺寸为5.4英寸,采用OLED屏幕,2340*1080像素分辨率,476ppi。重量133克约4.70盎司,高度131.5毫米约5.18
-
iphone 11和iphone12尺寸
数码极客iphone 11和iphone12尺寸 1、iPhone 11采用6.1英寸LCD屏,可通过调节白平衡,来与周围环境光色温相适配,支持轻点或抬起唤醒;iPhone 12手机尺寸为5.4英寸,采用了直面边框设
-
ios13小圆点在哪开,iphone 13小圆点怎么弄出来
数码极客ios13小圆点在哪开想要给ios13设置小圆点,先打开设置,在页面中找到通用,点击辅助功能,接着继续点击辅助触控,将其开启。此时屏幕上就会出现一个小圆点,点开后能够看到菜单栏,可根据自己的需求设置菜单里的快捷键,更方便使用。ios13小圆点设置方法1、打开手机,在主界面找到设置
-
12mini尺寸,iphone 12mini和12的尺寸对比
数码极客12mini尺寸 演示机型:Iphone 12mini系统版本:iOS14.4 iphone12mini整体的屏幕尺寸为5.4英寸,采用OLED屏幕,2340*1080像素分辨率,476ppi。重量133克约4
-
iphone touch在哪里设置
数码极客iphone touch在哪里设置 演示机型:Iphone 12系统版本:ios14 以Iphone 12,ios14系统为例:找到并打开手机设置app。在设置app页面,找到并打开通用功能按键。点击并打开通用
-
iphone 6s手机怎么改5g网络了
数码极客从iPhone 12起,iPhone手机终于开始支持5G网络,也算是iPhone产品生命周期内一件划时代的大事记,那么,手持iPhone12或者iPhone13的小伙伴,如何开启和更好的设置手中爱机的5G网络,使其发挥最大化的价值呢?首先我们来了解iPhone状态栏中的 5G 图
-
iPhone 夜间拍摄(苹果夜间拍摄app)
数码极客此前,iPhone拍夜景一直是个很大的痛点,好在从iPhone 11系列开始iPhone夜间拍摄有了较大的进步。iPhone 11在主摄像头中添加了「夜间模式」功能,而到iPhone 12系列更是把「夜间模式」复制到超广角镜头,夜间拍摄能力的提升可以帮助用户拍摄画质更加纯净的夜景
-
iphone 12 11月6日
数码极客哈喽黑粉们,欢迎来到黑马公社。最近由于疫情原因,全球供应链都受到了影响,进而各大手机厂商也深受影响,其中包括苹果。传闻中的iPhone 9也就是因为产能问题,迟迟未发布。这也引发了市场对于iPhone 12的担忧,是否还能如期发布?网上也时不时的就爆个料,说iPhone 12已经
-
iphone 12系列的优缺点
数码极客iPhone 12是苹果公司于美国西部时间2020年10月13日上午10点发布的手机产品,将也是苹果时隔多年首次将原有的圆润曲面以及2.5D弧度屏幕改成直角边框和平面玻璃,此举标志着苹果从iPhone6开始沿用多年的圆润设计的
-
iPhone 新用户指南
数码极客题记:1.0版本嘛,肯定会持续更新的,哪里没说到你们又想知道,尽管留言给我啦,这样才有素材和思路继续写2.0、3.0、N.0的啦~~前言2007年1月9日,初代iPhone正式发布。当苹果联合创始人史蒂夫·乔布斯在Macworld展会上骄傲地向大家展示这台“能接打电话的微型计算机