在传统的遣词造句脚本基础上,结合目前人工智能‘越来越能读懂人话’的特性,然后由真人作家创作一个梗概的作品大纲,训练机器人在‘读懂’的基础上遣词造句,扩写成一个相当于大纲字数数十倍的文本。
这个过程中,一开始应当以20被字数扩写率为目标,随着对人工智能的训练反馈越来越成熟,可以逐步实现五十倍、甚至百倍的套路文撰写——但是仅次于套路文,因为机器通过‘学习’学会写作的,肯定是套路文。”
“第一章要出金手指、前三章要出装逼打脸、五万字要小高潮。这种套路人类写手还要花时间去学习、记忆,而机器人写作完全可以通过程序设定来训练。人类最恶心最难记住或者不愿意做到的事情,在机器眼前反而是比较容易的。在人类很容易想到的故事大势等问题上,机器反而最难想通。所以,在辅助创作软件诞生的最初几年,要充分利用机器的优势、同时由人类手把手去训练、修正、最终审稿修改。”
当然,为了“深度学习”,最重要的是把机器人写好的稿子、由人类修改之后,再重新反馈给机器人,让其“学习”其中的差别。
深度学习,总的来说就是这么学习的,不断反馈此前答案的对错。就像谷歌和facebook当年训练人脸识别,就是给无数的图给机器识别,然后错的要告诉机器错了。久而久之,机器的模糊统计算法就“知道”什么是错的了。
朱子峰只是个业余的脚本编写者,他当年给某点闹事的时候,根本不懂深度学习算法,也没有那么好的产业视野。他那个孙达炮一样幼稚的想法,只有落到初音这样的巨头身上,才能变得有可操作性。
正如人工智能在实现自动驾驶的过程中,必须先借助‘辅助驾驶’。
人工智能在攻克国际象棋、围棋的时候,必须先借助人加机器的“半人马模式”,来实现比纯机器更好的效果。
在驾驶汽车的时候,在人脑看来最难的事情是应对突发事件,是“保持车辆精确保持与两边车道线的间距”。而这些事情在最初的辅助驾驶系统看来,就已经是很简单的了。
沃尔沃在被李叔福收购之前,已经实现了自动应对突发窜出的行人,以及保持车道间距。
但是,在人脑看来相对容易做到的事情,在机器眼里却是很难得。
比如预见中远期的可能危险。
又或者看到夜里对面远处有司机过来、而己方这边有其他车辆开着远光灯时、预测对方司机会不会出现方向抖动。
又或者是“预期刚才超车的人会不会赌气并线”这些显而易见的事情
这些问题人工智能的驾驶系统需要多年才会学会。
人类的长处是预见,机器的长处是精确,以及见招拆招。
自动驾驶是如此,初音人工智能研究院如今在攻克的围棋领域也是如此。
人类棋手或许害怕官子算不清,机器算法分分钟可以算清。人类高手喜欢前期布局做外势,而机器远远没法在需要高度远见的领域赶上人类。
在一切深度学习型人工智能领域里,最需要“远见”的细分领域,总是最晚被机器人攻克的。而在那些领域内坚持的人类,也往往是最后失业的。
不到半年,朱子峰那个辣鸡脚本被初音作为反面教材,剖析彻底吃干抹净,然后浴火重生出一个新的写作辅助工具,测试版的。
这个东西,已经可以做到在拿到套路文大纲的时候,读懂这个大纲,然后进行大约百倍字数的扩写。遣词造句和辞藻描写方面,而且已经学会了联系上下文,防止剧情崩溃。
如果开启“灌水”模式,这个写作辅助软件更是可以借鉴到无数人物、景物、动作描写,把一切可以水的地方再水一遍。两万字的大纲写成五百万字的小说都没问题。
当然了,这个东西目前还比较原始,要想用好,还是比较“挑大纲”的,如果大纲本身没头没脑机器识别比较困难,或者大纲本身就在灌水、或者格式套路不明显,机器还是没法写好。
写出来的作品,最后也还需要人工读一遍,解决掉一些逻辑上的明显硬伤。
至于错别字和用词不当,倒是不太容易出现,那本来就是机器的强项。
这个软件在初音原创内测通过之后,立刻投入了使用——当时,陈天乔还没下定卖网站的决心呢,初音方面自己也没有建网站,所以这个“使用”肯定是不能用在自己人身上的。
初音方面毫不犹豫地在对手的网站上测试自己的成果。(未完待续。)