需完成
- 获取斗鱼弹幕(通过API)
- 弹幕清洗及标注
- 显示实时弹幕
- 显示相关弹幕数据
- 无监督分词和jieba分词对比 无监督分词算法借鉴Matrix67大神
- 显示实时判别水军(通过分词实时弹幕再将其与word2vec生成模型进行比较)
- 建立专有停词表
- 降低实时弹幕显示时延
- 使用其他方法判别水军(如:SVM相关)
- 在上一步基础上使用多模态判别(弹幕+直播视频内容+主播音频内容)
使用过LDA模型但是无法确定截取弹幕时间,效果一般
使用过K-means聚类,效果一般
Python 3.5.3
前端:Vue
+Element-UI
后端:Django
数据库:MongoDB
+Redis