随机图文
落马官员“借走”200万后退赃 风头一过又要走
热潮来得快,去得更快。今年,共享单车就进入了寒冬。 去年还大把烧钱的共享单车,转眼就凉凉了。 但印度的创业者似乎有不同想法。从2017年开始,有近十年共享单车公司陆续出现,并先后拿到融资。 印度的共享单车市场正生机勃勃。 Amit Gupta是印度第一家独角兽Inmobi的联合创始人。在他创业十年、担任总裁级别职务的时候,他选择了急流勇退,创办
印度海军拟加强在印度洋长期部署 抗衡中国影响力
内容加密
动手做个DialoGPT:基于LM的生成式多轮对话模型
前段时间刷Arixv的时候,发现清华大学开源了一个大规模的中文闲聊语料库LCCC(论文链接,项目地址),从开源的文件上来看,这可能是目前开源的数量最大、质量最好的闲聊语料库了,而且还包含了部分多轮对话聊天,总的来说可玩性还是蛮强的。笔者也被它吸引到了,尝试着用它来训练了一个闲聊对话模型,结果看上去还是不错的,在此分享一下自己的经验。 语料简介 
QQ群关系数据库-qqGroup.zip
该QQ群数据库其实是2011年11月的时候被黑客从一个腾讯漏洞网站上脱裤下来的,里面包含了当时所有QQ号的基本个人信息与所加入群的对应关系以及群的一些基本信息,解压出来后数据库总大小超过了90G,用的是SQL Server 2000,以数据分片的形式存储,共有22个库。本次上传附件非原压缩包大小,用ZIP重新打包过,一共是34.8G 一、下载这个版本的SQL SERVER:


