用微博打造有趣的机器人账号

来源:ifanr.com 发布者:Wang 版权:转载

微博和 Twitter 都充斥着海量机器人营销账号,一旦你发出的信息包含它们所针对的关键词,就会引来大量 @。不过也有不那么招人讨厌,甚至可以算得上有趣的机器人营销账号。

微博和 Twitter 都充斥着海量机器人营销账号,一旦你发出的信息包含它们所针对的关键词,就会引来大量 @。不过也有不那么招人讨厌,甚至可以算得上有趣的机器人营销账号。年初开始走红,引来很多科技媒体报道的 Twitter 账号 @Horse_ebooks 就是一个例子。

@Horse_ebooks 每天最多发十来条推,从不用 @ 骚扰没关注自己的人。它所发内容基本都是随机从互联网上摘取后拼接的短句,平均每发四五条推就会夹杂一条带电子书销售链接——基本都是些丢亚马逊根本没人会买的书。@Horse_ebooks 目前已经有超过 75000 人关注。那些随机生成的无意义短句本是防止 Twitter 监测垃圾账号的手段,现在每条都引来很多人类账号回应。

《纽约时报》高级软件架构师 Jacob Harris 也被 @Horse_ebooks 所吸引,他用自己的业余时间打造了一个可读性更好的机器人账号 @nytimes_ebooks。Harris 在自己的博客解释了实现方法:

抓取《纽约时报》网站的 RSS feed;

通过代码自动抓取文章全文(《纽约时报》的 RSS feed 仅输出摘要);

摘取报道中打双引号的人物原话,这些内容一般比较精彩;

把这些话输入 Markov Chainer,将句子打散成短语;

调整文本以匹配 @horse_ebooks 的文风——以空格代替标点符号、如果有介词就截断最后一个单词;

当然,最后还要加上短链接,让读者直接看到链接来源是《纽约时报》。

最终结果很不错,而且有些句子被重组后甚至符合文章原意,比如“赢得民心、不穿防弹衣(winning hearts and not wearing body armor)”所指向的文章说的是海军一师 2004 年进入伊拉克以后的情况,当时不少陆战队员以为这是一次友好的军事行动。“Winning hearts and minds”这句话可以追溯到南北战争,从越战开始就很常用。

有些就比较费解,比如“Growth isn t the core value holding the strategy it”说的是律师行 Dewey & LeBoeuf 申请破产保护。

不过说实话,即便知道 @nytimes_ebooks 发的推都是随机凑出来的,我还是很想点进去看看文章到底在说什么。看来得考虑做个 @ifanr_ebooks。

关注【HIFI音响】公众平台

    ID:HIFI中国音响网 ID:hifidiy_2016