`
superisaac
  • 浏览: 62667 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

关于编写微博锐推机器人的吐槽。

阅读更多
周末看到新浪和腾讯上缺乏类似rtmeme/rtfocus之类的锐推机器人,以前在饭否上写过饭否小字报,就想看看能否为这些微博平台写一个,后来发现,不是别人不愿意写,而是国内的微博太奇葩了,没有适合这类机器人生存的小土壤也。

先上新浪微博平台,申请了应用,发现要上线得用oauth2认证,宣称oauth2认证更简单, 于是把代码从oauth1改成oauth2,期间各种文档中没有提及却遇到的问题就不说了,新浪的oauth2 access_token竟然有expire而没有refresh_token, 而且一天一过时(貌似应用审核后的是七天一过期)! 这意味着每天要手动重新授权一次才能保持机器人起码的工作, 每天要手动重启的还能叫机器人吗?

于是转到腾讯微博,腾讯微博的开发接口倒是稳定,采用oauth1授权,很快就搞定了,等机器人跑起来,这才发现,腾讯微博的活跃率比新浪微博低无数倍啊无数倍(这也许是新浪微博如此强势也是有凭借的)。follow一百多个人,一天下来只有5,6个人回fo. 推广不开一切都免谈。让其跑着也算惨淡经营吧。地址在 http://t.qq.com/wehuibao 求佛。

总结下经验教训, 国内微博广告和spam用户太多,机器人实现初期锐推的一大部分是广告用户,跑着广告,为了真实起见不得不把所有带链接的消息都不转。虚假用户的微博,他们公布的统计,流量数字真的有价值吗?

锐推机器人的算法基本原理,参照redit, rtmeme等实现原理的公开文档。就是一个简单的公式。
 
一条消息的价值 = C * (投票数:评论和转发数目) + 消息创建时间
 


C是一个常数,通常根据经验可以调整,C大,则投票数更有效,更加稳定,只管的表现是机器人推荐的消息频率低, 而C变小是,机器人推荐消息的频率高,经常有新的内容。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics