本文来自微信公众号:大数据文摘(ID:BigDataDigest),作者:王烨,原文标题:《用魔法打败魔法!用狗屁不通文章生成器写高三作文,评分软件给分84.4,打败73.5%学生》
高三,议论文,万千学子的噩梦。
我们见过大神引经据典,每一句都有出处;我们也记得自己绞尽脑汁,每一句都胡诌瞎编。

什么叫议论文?
议论文,又叫说理文,是一种剖析事物,论述事理,发表意见,提出主张的文体。作者通过摆事实、讲道理、辨是非、举例子等方法,来确定其观点正确或错误,树立或否定某种主张。
比如,“手机该不该进校园?”,这就是一个典型的议论文题目,或许你对这个问题早有答案,但是让你就这么一个问题写上800字,你行吗?
不管你行不行,反正文摘菌是不行了。
不过所谓万事万物相生相克(怎么感觉自己在写议论文……),继去年风靡一时的“狗屁不通文章生成器”成功帮助无数大学生“编写”了《防疫大课堂观后感》,如今又有同学将目光盯向了议论文。
不仅如此,他还将“狗屁不通文章生成器”写出来的议论文,给一款中文“中文作文智能批改”AI进行批阅评分。
结果也很喜感,“狗屁不通文章生成器”得分84.4分,打败了73.5%的学生。

网友感慨,“只有用魔法才能打败魔法”。

生成、截取、分段、打分、提交、评分,一气呵成
作者首先在一款“狗屁不通文章生成器”上输入了作文的主题——手机该不该进校园?
不得不说,高中议论文800字的规定还限制了生成器的发挥,作者不得已只从生成的几千字长文中截取了开头的900字左右。
而后,将这一段文章复制到一款“中文作文智能批改”软件中,这款软件还可以选择年级和文章类型。

值得注意的是,作者必须手动将一长段文章分成小段,以求层次分明。
然后就可以交给这个评分软件进行打分了。
尽管整个文章看起来就是车轱辘话,确实狗屁不通,但是打分软件给出了84.4的高分,还表示“你本次败了73.5%的学生”。

不仅如此,这款评分软件居然还给出了评语!
比如在开头,文章引用了拿破仑·希尔(一位成功学大师)的一句话“不要等待,时机永远不会恰到好处”。
评分软件给出评语,“巧妙引用,先声夺人,迅速切题”。

不得不说,真是让人哭笑不得,一个敢“狗屁不通”地写,一个敢“狗屁不通”地批。
神经网络:这个锅我可不背
整个测试的过程被作者做成了视频,放在了B站上,作者表示,这纯属娱乐。
随着这个视频在B站走红之后,许多网友都以为这都和AI有关。
有网友评论,“只有AI才能理解AI,只有人类才能理解人类”;

也有网友觉得这个和GAN(生成对抗网络)很相似;


不过有了解过的网友指出,“狗屁不通文章生成器”并不是AI。

这一点是得到“狗屁不通文章生成器”作者本人确认的。
“狗屁不通文章生成器”是去年一个非常火爆的GitHub项目,作者在项目里写道:
鄙人才疏学浅并不会任何自然语言处理相关算法,而且目前比较偏爱简单有效的方式达到目的方式,除非撞到了天花板,否则暂时不会引入任何神经网络等算法。不过欢迎任何人另开分支实现更复杂,效果更好的算法,不过除非效果拔群,否则鄙人暂时不会融合。

看来作者也的确拥有一个有趣的灵魂。
至于这款“中文作文智能批改”软件,很有可能也没有引入神经网络算法。
我们可以看到,在评语中,软件也只是在识别特征。
比如当识别到引用名言名句时,就会评价“巧用名言名句”等;当识别到“因为”、“所以”等关键词,就会评价“因果论证”等,全然不顾上下文有没有真正的因果关系。
其实也可以想见,以NLP目前的发展程度,写一篇前后逻辑通顺,主题明确的文章尚且如此困难,更何况要去评价高中生写的作文,还要给出准确的评语。
毕竟人类在评价别人的文章方面,也有翻车的时候,比如下面这位网友的故事。

本文来自微信公众号:大数据文摘(ID:BigDataDigest),作者:王烨