吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 8866|回复: 23
收起左侧

[Java 转载] [原创]基于Java网易云音乐评论抓取~【悠着点玩啊~】

  [复制链接]
bianqi 发表于 2017-12-11 00:56
本帖最后由 wushaominkk 于 2018-3-20 10:40 编辑

一般我们爬虫都是采用Python,自己闲的无聊就有Java编写一个简单的网易云音乐评论的抓取,这个仅仅是我开发的一个小小调试模块~目前数据保存在Mysql数据库中,后期考虑直接对接Hive存放到Hadoop采用Spark做数据分析~采用angel做机器模型训练,各位不要往死里玩哈~我还想做毕业设计呢~

下面是数据库的脚本


[SQL] 纯文本查看 复制代码
/*
SQLyog v10.2 
MySQL - 5.5.36 : Database - wangyi
*********************************************************************
*/


/*!40101 SET NAMES utf8 */;

/*!40101 SET SQL_MODE=''*/;

/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;
CREATE DATABASE /*!32312 IF NOT EXISTS*/`wangyi` /*!40100 DEFAULT CHARACTER SET utf8mb4 */;

USE `wangyi`;

/*Table structure for table `comments` */

DROP TABLE IF EXISTS `comments`;

CREATE TABLE `comments` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `userId` int(11) DEFAULT NULL,
  `commentId` bigint(20) DEFAULT NULL,
  `time` bigint(20) DEFAULT NULL,
  `content` varchar(255) NOT NULL,
  `likedCount` int(11) DEFAULT NULL,
  `songId` bigint(20) DEFAULT NULL,
  `nickName` varchar(255) NOT NULL,
  `avatarUrl` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=5513 DEFAULT CHARSET=utf8mb4 ROW_FORMAT=COMPACT;

/*!40101 SET SQL_MODE=@OLD_SQL_MODE */;
/*!40014 SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS */;
/*!40014 SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS */;
/*!40111 SET SQL_NOTES=@OLD_SQL_NOTES */;


代码的github地址
https://github.com/20100507/emotional_analysis 希望不要往死里抓啊~~~
下面就是程序采集中的截图,我采用的forkjoin框架四核一分钟1.3W评论,如果是8核效果会更好~

程序截图

程序截图

程序截图

程序截图

数据库截图

数据库截图

程序截图

程序截图

免费评分

参与人数 11吾爱币 +9 热心值 +9 收起 理由
孤独的明月 + 1 + 1 我很赞同!
Endream + 1 + 1 热心回复!
粤东第一大狗 + 1 我很赞同!
sun20052677 + 1 + 1 热心回复!
Jackjoily + 1 + 1 我很赞同!
Zhenwu1080 + 1 + 1 热心回复!
chinhung + 1 + 1 谢谢@Thanks!
韦几 -1 网易云的评论最为弱z,纯复制粘贴,你还当宝!
rack + 1 + 1 谢谢@Thanks!
wentwent + 1 + 1 谢谢@Thanks!
War-Horse + 1 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

胡椒粉 发表于 2017-12-11 02:23
不懂。干什么的
极地企鹅 发表于 2017-12-11 02:51
music984 发表于 2017-12-11 08:04
巨无霸 发表于 2017-12-11 08:22
这个是抓取评论?不能抓取音频?
Chomskyer 发表于 2017-12-11 08:29
楼主爬了这么多数据是想要干啥啊
wentwent 发表于 2017-12-11 08:53
很强大 很厉害
棉花糖的女主人 发表于 2017-12-11 09:01
抓取评论什么意思?
昔年谁是谁非 发表于 2017-12-11 09:13
可以看看,我前两个月也刚好写了个用java小说爬虫
weliong 发表于 2017-12-11 09:54
抓评论有何用
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-20 01:31

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表