豆包输入法屌爆了!
备注:本文除此段外,均为豆包输入法语音直出,连标点符号都是输入法智能识别添加。
由于最近临近年关,手头的杂事太多,能够分给写作码字的时间和精力越来越少。我一直在想办法,能不能尽量让码字这件事变得更轻松一点。
还真让我找到了办法,答案是豆包输入法。大约一个月以前,豆包输入法突然在小红书爆火起来。当时它还在内测,许多用户参加完内测之后惊呼。从来没有这么神奇的语音输入体验,不管是方言也好,普通话也好,甚至中英混输也好。豆包输入法基本能够百分百精准捕捉。说话者的输入意图在以前。没有任何输入法能够做到这个地步。包括以语音输入、语音识别渐长的讯飞输入法。
说起讯飞输入法,还想插一句,我一直觉得这个公司走的是跟华为差不多的路子,基本都是靠公关政府。拿政府项目挣钱。这种挣钱方法与其说是挣钱,倒不如说是在套取公款。我为什么这么说呢?因为从实际使用体验上来看,讯飞输入法实在很一般,市场不会说谎。如果讯飞真有那么强的话,那么它可能早就先于豆包完成了。对输入市场的颠覆,而实际情况并没有。讯飞的语音识别出现最频繁的场景是哪里呢?我见到的情况哈,是法院。法院的法庭中,为了提高书记员记录效率,都配备了语音识别系统。这个语音识别系统就是讯飞做的。当然了,这个语音识别系统也说不上太差。对于我这样普通话很标准、语速也适中的律师来说,基本能够准确识别。但是当事人本人说话,一方面口音重,另外一方面语无伦次,逻辑感差,识别效果就比较差了。
昨天也是抱着试一试的想法,下载了豆包输入法。开始使用之前,我想,再惊艳能惊艳到哪去?结果实际一用,真他妈给我惊艳到了。就怎么说呢?你就是找个律师助理,或者找一个文秘,而且是会速录的那种。你边说它边记,效果可能都没有豆包输入法强大。这个豆包输入法真的是能够完全取代速录师这个职业的存在,真正意义上实现了AI对某个行业的彻底颠覆。
我在广州市海都区开庭的时候,见识过一次速录师。速录师用的键盘,当然这个是要打引号的键盘,跟我们常用的标准键盘完全不一样。那个键盘很小,好像总共就十来个键,每个手指分别对应一个,能够节省手指寻键的时间。而且那个键盘打字的时候动作很大。我在开庭的时候注意到那个书记员两只手就像是在怎么说呢?就像是在捣面糊,或者说是搓毛巾那种动作幅度一样。我当时还很奇怪说,这个书记员在干嘛?后来一个当地的律师说,他在打字呀。我说打字还有这么打的?他说我们这边的书记员都要通过速录师考试的,都有速录证。他们用的那个设备叫做速录机。后来开完庭后,我核对笔录,简直惊呆了。一般的庭审,尤其是我们内地这边的庭审。开完庭之后,书记员先是要从头到尾核对更正笔录。这个一般就要很长时间。如果是开庭时间持续比较长的刑事庭审,许多书记员还会让你先走,等他整理完之后再来法院签,因为当场实在是弄不完。但是当天那个庭审,法官刚敲完法槌休庭,书记员就把笔录打出来了。我大概核对了一下我自己发言的内容,不光意思完全归纳到位,而且就连实际的用语甚至包括我当时通过用语的组织结构来传达的语气和情感,都完全得到了保留。也就是说,他速录的效率跟我的语速能够完全匹配的,让我大开眼界。
我那次去广州开庭也就是三四年前的事,现在科技发展实在是太快了。短短三四年时间,这个令人惊叹的职业就要被彻底取代了。
豆包输入法在语音识别领域的发力,显然已经具备了改善市场格局的潜在能力。不仅在用户领域引起了广泛关注,同样引起了竞争者的高度警觉。目前最好用的新时代输入法应该是微信输入法。搜狗虽然是老牌输入法,但是很多设计理念有点陈旧了。而且历史包袱重,冗余功能太多,实际体验上被微信吊打。微信自从取得霸主地位之后,也开始有点不思进取了。别的不说,就这个语音识别简直是稀烂。落后到什么程度呢?在开始识别之前,还需要先手动点选自己说的是什么话,是普通话还是方言,是英语还是中文。如果说方言的话,还要自己选是说的河南话、粤语、闽南话,种种诸如此类,根本就不具备混合识别能力。搭载的语音识别引擎甚至跟搜狗这些古董输入法没什么两样。
豆包输入法在市场上引起轰动后,微信立马更新了大版本。跟进了语音识别功能。这可能也是腾讯公司的核心优势之一吧。这个公司并不善于创新,但很善于跟进模仿,有点类似于软件界的小米。很会整合各种功能。然后利用自己庞大的流量优势、资源优势。对创新者实现全面赶超,取而代之。在下载豆包输入法之前,我也。试着用了一下大版本更新后的微信输入法。主要是体验。它的语音识别功能实际使用下来确实有提升,但远远谈不上惊艳。豆包输入法的语音识别是能够完全实实现。脱手的,也就是说你尽管把麦克风打开,对着说话就行了。全程用不着手动干预,但微信还是差得多。每说三五句话,就一定会出现个别字词。识别不精准,断句不准确,标点符号不匹配。等等小问题,不要忽视这些小问题,正是这些小问题。形成了豆包输入法的护城河。这个有点像马斯克评价自动驾驶。当时,特斯拉的工程师向马斯克汇报说,我们的自动驾驶。取得了什么什么样的进步?马斯克直接当头泼了一盆冷水。说目前我们所取得的一切成就,哪怕已经实现了99% 的自动驾驶。但也是毫无意义的,真正的困难。在最后的百分之一。只有走完了最后1%,才算真正搞定了自动驾驶。语音输入法也是这样。豆包之前所有的语音输入法,都只是在1% 到99% 这个区间之内,唯有豆包实现了99% 到100% 的突破,做到了能够完全脱手使用。就是这一点点体感上的差别,造就了它的断档领先。
今天这些字完全是缩在温暖的被窝里,用豆包输入法语音输入的。刚才大概翻看了一下,不知不觉已经输入了2000来字。我曾在不同场合说过,我不是一个很有码字天赋的人,具体的表现是码字时很难保持一以贯之的专注。码不上几十个字,就要切出去干点其他的事。但是语音输入好像就没有这个问题。之前不知道在哪里看过一篇科普文章,说的就是这个问题。印象中大概意思是说,人的思想和语言其实是交织在一起的,二者互为依存,语言既是思想的工具。也是承载思想的载体。甚至有个哲学家说过这样一句话,语言的边界就是思想的边界。但思想与肢体动作间显然就没有这么密切的协同,这就导致你在用手指敲字的时候,你需要同时调用语言中枢和动作中枢。这或许是导致码字无法长时间专注的罪魁祸首。当然了,这只是我个人的感受,也是我个人的一些猜测,不一定具有普适的价值。但在使用语音输入的时候,完全没有这种感觉。我几乎是一口气说了这么多话。没有任何跳转。当然,这跟现阶段语音输入法的能力边界也有关系。它只能做到识别你的输入意图,但还无法全面判断你是否属于输入状态。举个例子来说吧,你正在对着豆包输入法码字的时候,突然你老婆喊你吃饭,这时无论你吃或者不吃。你肯定要回答你老婆一句,你回答的这一句其实就不属于你要输入的内容。但是现阶段,哪怕是豆包输入法也做不到把这句话单独给摘出来。未来的语音输入一定会在更加智能的方向上发展,最终做到连你所说的话是否具备输入意图都能准确识别。但对我来说对于我个人来说,未必是一件好事。因为那样就意味着,你可以在输入的时候,随时把大脑的注意力切换到别的地方,反而不利于像我这样的输入者保持专注。就现在这个状态就很好,一旦我开启了语音识别,那就意味着我需要在同一个界面持续保持专注。如果按照小红书的确诊标准,我应该属于ADHD。 但是小红书吧,大家都懂的,人均精神病患,不能太当真。
豆包输入法的这个能力不仅限于。躺在床上码字。它的使用场景可以更加广泛,比如可以边开车边码字。开车时候人的大脑状态跟做瑜伽呀、慢跑呀其实差不多。开车本身消耗的大脑算力非常低,可以忽略不计。而且同时你的身体各个部位。都要被限制动作,结果就是你的大脑。思绪飞扬,神游万里,我经常在开车的时候脑子里蹦出许多奇思妙想,但非常遗憾,由于双手不能离开方向盘,这些奇思妙想没办法记录下来,很快就给忘了,是一笔很大的损失。将来完全可以打开豆包输入法,一边开车一边码字。
使用场景的拓展,其实还不是对码字助力最多的地方。对于任何一个日更码字的人来说,首当其冲的任务是尽可能最大化的降低码字这件事的阻力感。你经常会看到许多攻略啊,或者说分享帖呀,说什么码字之前最好要有一定的仪式感,固定时间、固定地点,甚至固定动作流程,先给自己泡杯咖啡、敷个面膜,什么什么的。我不知道这些人自己是真的在这样做,还是只是想当然。就我个人这几年来的实际感受来说。搞得越有仪式感,前置动作越多,就会让开始码字这件事阻力越大。你可能脑子里边刚蹦出来一个好点子,正想坐下来写。但同时你又想到,我还需要先给自己泡杯茶,整个香薰,敷个面膜。最终更可能的结果是,就这么算了,不码了。太麻烦了。豆包这种近乎完美的语音识别准确率,零门槛的码字状态进入,可以将码字这件事的阻力接近完全消除,让码字这件事跟说话之间的鸿沟抹平。从此,码字就从一项需要专门从事的活动,降级成了跟说话喘气一样的日常行为。显然,对于长期扎根码字的弊益,远远大于码字场景的扩展。
当然,任何一项选择都不可能只有收益,没有损失。口头语与书面语的内在组逻辑结构一定是有差别的。哪怕是号称怎么说就怎么写的白话文,也是如此。许多人说起话来口若悬河,包袱一个接一个。但是落到纸上就是抓耳挠腮,半天憋不出来几句话。过度依赖语音输入、口头表达,是否能提高自己的书面语能力,目前还不确定。一种更深层次的隐忧是,不仅不会提高书面语能力,反而会降低。如果那样的话,显然就得不偿失了。
对于任何一项科技进步,人类恐怕都很难完整而准确的预测,它会对这个世界,对我们的生活带来什么样的改变。或许在AI技术的加持下,未来的人类根本不需要再像我们这代人一样。学习打字,他们从一开始接触人机交互,用的就是语音识别。长此以往,书面语和口头语之间的界限会进一步模糊。事实上,这也是过去上千年来全世界所有语系中正在发生的事情。今天的中国人很难读懂《史记》和《资治通鉴》,今天的英国人也很难读懂莎士比亚的十四行诗。当口头语和书面语之间的界限被完全打破之后,自然就不存在我所担心的过度依赖口头表达而导致书面表达能力下降的问题了。
版权声明:本文由刑辩人在路上发布,如需转载请注明出处。
法律咨询或案件委托,请将相关案件材料及您的诉求发送至邮箱:liuchen8916@foxmail.com



