分享

基于springboot+redis+国际化+定时任务的疫情项目

问题导读:
1、如何理解搜索引擎原理?
2、如何进行数据分析流程设计?
3、Mybatis如何进行整合?
4、图形化数据如何处理?


文章目录
    一、效果图
    二、技术栈
    三、项目背景
    四、搜索引擎原理
    五、数据分析
        5.1 分析数据源
        5.2 获取疫情数据
    六、数据处理
        6.1 初识json
        6.2 数据展示
    七、网络请求
    八、数据存储
        8.1 Mybatis整合
        8.2 数据初始化及定时更新
    九、图形化数据处理
        9.1 折线图
        9.2 地图
        9.3 拓展部分
    十、页面数据处理
    十一、国际化
    十二、Redis的使用

一、效果图
2022-04-20_192021.jpg

2022-04-20_192043.jpg
2022-04-20_192106.jpg

二、技术栈
  •     基础框架(springboot + mybatis + mybatis-plus)
  •     缓存数据(redis)
  •     国际化(一键切换不同语种)
  •     定时任务(定时更新数据)
  •     爬虫
  •     加密
  •     感知数据变更,进行通知推送
  •     日志监控
  •     数据计算和二次存储(为图表服务 - 比如趋势图)
  •     数据展示和渲染 Thymeleaf Echarts
  •     模拟http请求

三、项目背景

模拟疫情数据展示网站,做出一个完整的数据采集、数据存储、数据计算、数据展示的疫情数据系统。

四、搜索引擎原理

链接人和内容

网页爬取 -》 网页去重 -》 网页分析 -》 内容保存(倒排索引)

关键字查询 -》 关键字分析 -》 去匹配内容 -》 筛选出比如100条数据 -》 数据排序 (可口可乐的秘方)

分类:
通用型爬虫 和 垂直型爬虫

疫情数据系统:
数据采集 -》 数据存储 -》 数据计算 -》 数据展示

五、数据分析


5.1 分析数据源

确认能够通过代码 获取到数据 (定位到具体的http请求)

5.2 获取疫情数据
  •     国内各省份表格数据-对应请求
  •     对应的数据格式:json
  •     国外表格数据-对应请求
  •     国内趋势数据

六、数据处理


6.1 初识json

  •     json = javascript object notation (js对象表示法)
  •     独立于语言,具有自我描述性


2022-04-20_192144.jpg

  1. <div>
  2. </div><div>Gson -> From Google
  3.     new Gson().toJson(Object obj) 将对象转化为json字符串
  4.     new Gson().fromJson(String jsonStr, T.class) 将json字符串转化为对象</div>
复制代码


6.2 数据展示

  1. controller - service - handler
复制代码

数据加载到model中 返回给html渲染

  1. @Controller
  2. public class DataController {
  3.     @Autowired
  4.     private DataService dataService;
  5.     @GetMapping("/")
  6.     public String list(Model model) {
  7.         List<DataBean> beanList = dataService.list();
  8.         model.addAttribute("beanList", beanList);
  9.         return "list";
  10.     }
  11. }
复制代码
  1. public interface DataService {
  2.    
  3.     List<DataBean> list();
  4. }
  5. @Service
  6. public class DataServiceImpl implements DataService {
  7.     @Override
  8.     public List<DataBean> list() {
  9.         return MyDataHandler.getData();
  10.     }
  11. }
复制代码
  1. <!DOCTYPE html>
  2. <html lang="en" xmlns:th="http://www.thymeleaf.org">
  3. <head>
  4.     <meta charset="UTF-8">
  5.     <title>Title</title>
  6. </head>
  7. <body>
  8. <h2> 国内疫情情况如下 </h2>
  9. <br>
  10. <table>
  11.     <thead>
  12.     <tr>
  13.         <th>地区</th>
  14.         <th>现有</th>
  15.         <th>累计</th>
  16.         <th>治愈</th>
  17.         <th>死亡</th>
  18.     </tr>
  19.     </thead>
  20.     <tbody>
  21.     <tr th:each="bean:${beanList}">
  22.         <td th:text="${bean.area}">name</td>
  23.         <td th:text="${bean.nowConfirm}">nowConfirm</td>
  24.         <td th:text="${bean.confirm}">confirm</td>
  25.         <td th:text="${bean.heal}">heal</td>
  26.         <td th:text="${bean.dead}">dead</td>
  27.     </tr>
  28.     </tbody>
  29. </table>
  30. </body>
  31. </html>
复制代码



七、网络请求

HTTP

  •     “应用层协议”
  •     了解HTTP不同版本的演进
  •     了解GET和POST请求的区别

  1.     // 需要的参数url
  2.     // 创建一个远程的连接对象  设置方法类型 GET
  3.     // 设置相关参数    发送请求
  4.     // 通过io接收数据后返回
  5.     public static String doGet(String urlStr) {
  6.         HttpURLConnection conn = null;
  7.         InputStream is = null;
  8.         BufferedReader br = null;
  9.         StringBuilder result = new StringBuilder();
  10.         try {
  11.             // 创建远程url连接对象
  12.             URL url = new URL(urlStr);
  13.             // 打开一个连接
  14.             conn = (HttpURLConnection) url.openConnection();
  15.             // 设置为GET请求
  16.             conn.setRequestMethod("GET");
  17.             // 设置重要的参数  连接超时时间 和 读取超时时间
  18.             // 超时时间  更多被距离影响   读取时间  更多被数据量影响
  19.             conn.setConnectTimeout(15000);
  20.             conn.setReadTimeout(60000);
  21.             // header参数设置  可以不设置
  22.             conn.setRequestProperty("Accept", "application/json");
  23.             // 发送请求
  24.             conn.connect();
  25.             // 状态码  200  302  404  500 ?
  26.             // 如果比较时  可能出现空指针  把确定的值放在前面  可以避免
  27.             if (200 == conn.getResponseCode()) {
  28.                 is = conn.getInputStream();
  29.                 br = new BufferedReader(new InputStreamReader(is, "UTF-8"));
  30.                 String line;
  31.                 while ((line = br.readLine()) != null) {
  32.                     result.append(line);
  33.                 }
  34.             } else {
  35.                 System.out.println("error responseCode :"
  36.                         + conn.getResponseCode());
  37.             }
  38.         } catch (Exception e) {
  39.             e.printStackTrace();
  40.         } finally {
  41.             try {
  42.                 if (br != null) {
  43.                     br.close();
  44.                 }
  45.                 if (is != null) {
  46.                     is.close();
  47.                 }
  48.             } catch (Exception e) {
  49.                 e.printStackTrace();
  50.             }
  51.             conn.disconnect();
  52.         }
  53.         return result.toString();
  54.     }
复制代码



八、数据存储

8.1 Mybatis整合

SSM的整合 -> 入门课的整合 -> mybatis-plus的整合

明确数据结构 -> 创建mapper文件夹 -> 调用getData方法 将数据据存储到数据库中 -> 查询时从数据库中读取

a) 引入依赖
  1.         <!-- mybatis整合
  2.              mybatis-spring-boot-starter
  3.              mybatis-plus -boot-starter
  4.              mysql驱动-->
  5.         <dependency>
  6.             <groupId>org.mybatis.spring.boot</groupId>
  7.             <artifactId>mybatis-spring-boot-starter</artifactId>
  8.             <version>2.1.1</version>
  9.         </dependency>
  10.         <dependency>
  11.             <groupId>com.baomidou</groupId>
  12.             <artifactId>mybatis-plus-boot-starter</artifactId>
  13.             <version>3.2.0</version>
  14.         </dependency>
  15.         <dependency>
  16.             <groupId>mysql</groupId>
  17.             <artifactId>mysql-connector-java</artifactId>
  18.             <scope>runtime</scope>
  19.         </dependency>
复制代码
b) 配置数据库连接参数

  1. spring.datasource.url=jdbc:mysql://localhost:3306/illness?characterEncoding=utf8
  2. spring.datasource.username=root
  3. spring.datasource.password=123456
复制代码

c) 创建数据库

  1. CREATE DATABASE /*!32312 IF NOT EXISTS*/`illness` /*!40100 DEFAULT CHARACTER SET utf8 */;
  2. USE `illness`;
  3. /*Table structure for table `epidemic` */
  4. DROP TABLE IF EXISTS `epidemic`;
复制代码
  1. CREATE TABLE `epidemic` (
  2.   `id` bigint(20) NOT NULL AUTO_INCREMENT,
  3.   `area` varchar(100) DEFAULT NULL,
  4.   `confirm` int(11) DEFAULT NULL,
  5.   `now_confirm` int(11) DEFAULT NULL,
  6.   `dead` int(11) DEFAULT NULL,
  7.   `heal` int(11) DEFAULT NULL,
  8.   PRIMARY KEY (`id`)
  9. ) ENGINE=InnoDB AUTO_INCREMENT=308 DEFAULT CHARSET=utf8;
复制代码



d) 编写类及文件夹

将实体类对应到数据库的表中 属性和字段也需对应

需注意 属性的命名为驼峰命名法

如 nowConfirm 字段的命名是下划线分隔 如 now_confirm

可以使用@TableName和@TableField等注解指定对应关系

  1. @Data
  2. @NoArgsConstructor
  3. @AllArgsConstructor
  4. @TableName("epidemic")
  5. public class DataBean implements Serializable {
  6.     // Alt + Insert 调用   安装插件
  7.     private static final long serialVersionUID
  8.             = 4938260405189292371L;
  9.     // Alt + 7 查看类的方法
  10.     // 地区  累计确诊人数  现有确诊人数   死亡人数  治愈人数
  11.     private long id;
  12.     private String area;
  13. //    @TableField("all_confirm")
  14.     // 如果属性名和表中字段名  不一致  可以通过 TableField注解指定
  15.     private int confirm;
  16.     private int nowConfirm;
  17.     private int dead;
  18.     private int heal;
  19. }
复制代码


在主程序类上 增加@MapperScan注解 指定mapper类所在文件夹

在此文件夹下 创建mapper类 实战中 如表名叫user mapper会命名为UserMapper

  1. @SpringBootApplication
  2. @MapperScan("com.duing.mapper")
  3. public class DataHandlerApplication {
  4.     public static void main(String[] args) {
  5.         SpringApplication.run(DataHandlerApplication.class, args);
  6.     }
  7. }
  8. public interface DataMapper extends BaseMapper<DataBean> {
  9. }
复制代码

创建service接口及其实现类

整合mybatis-plus,用其提供的IService父接口 和 ServiceImpl实现父类

  1. public interface DataService extends IService<DataBean> {
  2. }
  3. @Service
  4. public class DataServiceImpl
  5.         extends ServiceImpl<DataMapper,DataBean>
  6.         implements DataService {
  7. }
复制代码

在controller中调用mybatis-plus实现的CRUD方法

  1. @Controller
  2. public class DataController {
  3.     @Autowired
  4.     private DataService dataService;
  5.     @GetMapping("/")
  6.     public String list(Model model) {
  7.         List<DataBean> beanList = dataService.list();
  8.         model.addAttribute("beanList", beanList);
  9.         return "list";
  10.     }
  11. }
复制代码

8.2 数据初始化及定时更新

在数据查询前,先将数据存储到数据库中,我们称之为数据初始化

可以在项目启动时,先采集一次数据存储到数据库中,然后再进行定期更新

而项目启动时执行且只执行一次的逻辑,可以使用注解 @PostConstruct

  1. //  先将DataHandler托管到spring容器中  使用@Component
  2. //  以便于获取到 dataService对象
  3. @Component
  4. public class DataHandler {
  5.     @Autowired
  6.     private DataService dataService;
  7.     // 数据初始化
  8.     //   在服务器加载Servlet时运行  且 只运行一次
  9.     @PostConstruct
  10.     public void saveData() {
  11.         List<DataBean> dataBeans = getData();
  12.         // mybatis-plus提供了可用的方法
  13.         // 删除全部数据  批量新增数据
  14.         dataService.remove(null);
  15.         dataService.saveBatch(dataBeans);
  16.     }
  17. ...
  18. }
复制代码

定时更新其实也是定时任务

可以通过注解@Scheduled + cron表达式来实现

Scheduled 英文原意是调度的意思 意思是我们将某段逻辑 按照指定的时间间隔 进行调度 即为定时处理

使用方式如下:

首先在入口类上 打开定时任务开关 使用注解 @EnableScheduling

  1. @SpringBootApplication
  2. @MapperScan("com.duing.mapper")
  3. @EnableScheduling
  4. public class DataHandlerApplication {
  5.     public static void main(String[] args) {
  6.         SpringApplication.run(DataHandlerApplication.class, args);
  7.     }
  8. }
复制代码

然后在方法上 使用 @Scheduled 搭配cron表达式 决定方法多久执行一次

  1.     // 定时更新
  2.     @Scheduled(cron = "0 0 0/1 * * ? ")
  3.     public void updateData(){
  4.         System.out.println("要更新数据啦");
  5.         System.out.println("当前时间:" + dateFormat.format(new Date()));
  6.         List<DataBean> dataBeans = getData();
  7.         dataService.remove(null);
  8.         dataService.saveBatch(dataBeans);
  9.     }
复制代码

其中cron表达式,是由6个表达不同时间单位的字段拼接而成

可以通过在线cron表达式生成器来生成
2022-04-20_192323.jpg

cron表达式几乎可以满足所有定时执行的需求

可以生成各类需求对应的表达式熟悉一下

除此之外,@Scheduled还支持固定时间间隔的参数设置

分别为 fixedRate 和 fixedDelay

  1. // 固定频率任务   以ms为单位  10000代表每10s执行一次
  2. //   使用时要注意间隔时间  和  任务消耗时间的  大小关系      
  3. //   如设置间隔10s  而方法需执行20s   那么方法会等待上一次执行完成才会执行  
  4. //   唤起方法真正的时间间隔为20s
  5. @Scheduled(fixedRate = 10000)
  6. public void updateData1(){}
  7. // 固定间隔任务   上一次执行结束后   再隔10s进行下一次执行
  8. // 如设置间隔10s  而方法需执行20s   那么会从上一次执行完成后开始计算  10s后开始下一次执行
  9. // 唤起方法真正的时间间隔为30s
  10. @Scheduled(fixedDelay = 10000)
  11. public void updateData2(){}
复制代码

九、图形化数据处理

9.1 折线图

  1. <!DOCTYPE html>
  2. <html lang="en" xmlns:th="http://www.thymeleaf.org">
  3. <head>
  4.     <meta charset="UTF-8">
  5.     <title>Title</title>
  6.     <script type="text/javascript" src="js/echarts.min.js"></script>
  7. </head>
  8. <body>
  9. <!-- 为ECharts准备一个具备大小(宽高)的Dom -->
  10. <div id="main" style="width: 600px;height:400px;"></div>
  11. <script th:inline="javascript">
  12.     var dateStr = [[${dateList}]];
  13.     var confirmStr = [[${confirmList}]];
  14.     var suspectStr = [[${suspectList}]];
  15.     // 基于准备好的dom  初始化实例
  16.     var mychart = echarts.init(document.getElementById("main"));
  17.     var option = {
  18.         // 标题
  19.         title:{
  20.             text: '全国疫情新增趋势'
  21.         },
  22.         legend:{
  23.             data:['新增确诊','新增疑似']
  24.         },
  25.         // x轴的数据
  26.         xAxis:{
  27.             data: dateStr
  28.         },
  29.         // y轴的数据类型
  30.         yAxis:{
  31.             type:'value'
  32.         },
  33.         series:[
  34.             {
  35.                 name: '新增确诊',
  36.                 type: 'line',
  37.                 data: confirmStr
  38.             },
  39.             {
  40.                 name: '新增疑似',
  41.                 type: 'line',
  42.                 data: suspectStr
  43.             }
  44.         ]
  45.     };
  46.     // 将参数设置进去
  47.     mychart.setOption(option);
  48. </script>
  49. </body>
  50. </html>
复制代码

9.2 地图

  1. <!DOCTYPE html>
  2. <html lang="en" xmlns:th="http://www.thymeleaf.org">
  3. <head>
  4.     <meta charset="UTF-8">
  5.     <title>Title</title>
  6.     <script type="text/javascript" src="js/echarts.min.js"></script>
  7.     <script type="text/javascript" src="js/china.js"></script>
  8. </head>
  9. <body>
  10. <!-- 为ECharts准备一个具备大小(宽高)的Dom -->
  11. <div id="main" style="width: 1000px;height:700px;"></div>
  12. <script th:inline="javascript">
  13.     var dataStr1 = [[${mapData1}]];
  14.     var dataStr2 = [[${mapData2}]];
  15.     // 基于准备好的dom  初始化实例
  16.     var mychart = echarts.init(document.getElementById("main"));
  17.     var option = {
  18.         title: {
  19.             text: '疫情地图',
  20.             subtext: '仅供参考',
  21.             x: 'center'
  22.         },
  23.         tooltip: {
  24.             trigger: 'item'
  25.         },
  26.         legend: {
  27.             orient: 'vertical',
  28.             left: 'left',
  29.             data: ['现有确诊', '累计确诊']
  30.         },
  31.         visualMap: {
  32.             type: 'piecewise',
  33.             pieces: [
  34.                 {min: 10000, max: 1000000, label: '10000人及以上', color: '#de1f05'},
  35.                 {min: 1000, max: 9999, label: '1000-9999人', color: '#ff2736'},
  36.                 {min: 500, max: 999, label: '500-999人', color: '#ff6341'},
  37.                 {min: 100, max: 499, label: '100-499人', color: '#ffa577'},
  38.                 {min: 10, max: 99, label: '10-99人', color: '#ffcea0'},
  39.                 {min: 1, max: 9, label: '1-9人', color: '#ffe7b2'},
  40.                 {min: 0, max: 0, label: '0人', color: '#e2ebf4'},
  41.             ],
  42.             calculate: true
  43.         },
  44.         series: [
  45.             {
  46.                 name: '现有确诊',
  47.                 type: 'map',
  48.                 mapType: 'china',
  49.                 roam: false,
  50.                 label: {
  51.                     normal: {
  52.                         position: 'center',
  53.                         show: true
  54.                     }
  55.                 },
  56.                 data: JSON.parse(dataStr1)
  57.             },
  58.             {
  59.                 name: '累计确诊',
  60.                 type: 'map',
  61.                 mapType: 'china',
  62.                 roam: false,
  63.                 label: {
  64.                     normal: {
  65.                         position: 'center',
  66.                         show: true
  67.                     }
  68.                 },
  69.                 data: JSON.parse(dataStr2)
  70.             }
  71.         ]
  72.     };
  73.     // 将参数设置进去
  74.     mychart.setOption(option);
  75. </script>
  76. </body>
  77. </html>
复制代码

9.3 拓展部分

我们可以根据国内表格数据的处理方式、以及图形化数据的处理方式,举一反三的去处理海外数据,只要掌握了处理流程,其实是可以模拟腾讯新闻,将全部数据展示出来的,要注意的是,我们的项目是为了练习springboot+mybatis+thymeleaf+echarts的使用,了解http请求+json数据处理+定时任务等等功能是如何实现的,那么对数据采集方面要慎重,尽量只采集需要的少部分数据,并且控制请求次数和请求频率,一定要做到“友好访问”。


十、页面数据处理

Jsoup(Ji soup 鸡汤)----页面解析器

解析一个HTML文档的方式如下:
  1. String html = "<html><head><title>First parse</title></head>"
  2. + "<body><p>Parsed HTML into a doc.</p></body></html>";
  3. Document doc = Jsoup.parse(html);
复制代码

解析器能够尽最大可能从你提供的HTML文档中创建出一个干净的解析结果,无论HTML的格式是否完整。
比如它可以处理:

1)没有关闭的标签
   <p>Lorem <p>Ipsum  
   可以解析成
   <p>Lorem</p> <p>Ipsum</p>
2)隐式标签 (补充没有显示的标签)
   它可以自动将 <td>Table data</td> 包装成 <table><tr><td>...
3)创建可靠的文档结构  
   html标签包含head 和 body,且在head只出现恰当的元素
   
文档的对象模型               
1)文档由多个Elements和TextNodes组成
2)继承结构如下:Document继承Element继承Node. TextNode继承 Node.
3)一个Element包含一系列的子节点,并拥有一个父Element。他们还唯一提供了一个子元素过滤列表。


十一、国际化

根据不同的用户群,显示不同的语言,此功能叫做国际化,如丁香医生页面切换语种的功能。

要想实现动态显示不同语言,首先要将页面中的数据转为动态显示,放在配置文件中读取

创建list.properties

  1. list.title=步尔斯特
  2. list.h2=国内疫情情况如下
  3. list.table.name1=地区
  4. list.table.name2=现有确诊
  5. list.table.name3=累计确诊
  6. list.table.name4=治愈
  7. list.table.name5=死亡
复制代码

我们将list.properties放在i18n的文件夹下,然后在application.properties中设置好指定配置

  1. spring.messages.basename=i18n.list
复制代码

这样就可以再创建一个list_en_US.properties文件,内容如下
  1. list.title=burst
  2. list.h2=As Follows
  3. list.table.name1=Area
  4. list.table.name2=Now Confirm
  5. list.table.name3=Confirm
  6. list.table.name4=Heal
  7. list.table.name5=Dead
复制代码

对应的list.html页面修改如下

  1. <!DOCTYPE html>
  2. <html lang="en" xmlns:th="http://www.thymeleaf.org">
  3. <head>
  4.     <meta charset="UTF-8">
  5.     <title th:text="#{list.title}">Title</title>
  6.     <link rel="stylesheet" th:href="@{css/bootstrap.css}">
  7. </head>
  8. <body>
  9. <h2 th:text="#{list.h2}"> 国内疫情情况如下 </h2>
  10. <br>
  11. <table class="table table-hover">
  12.     <thead>
  13.     <tr>
  14.         <th><p th:text="#{list.table.name1}">地区</p></th>
  15.         <th><p th:text="#{list.table.name2}">现有</p></th>
  16.         <th><p th:text="#{list.table.name3}">累计</p></th>
  17.         <th><p th:text="#{list.table.name4}">治愈</p></th>
  18.         <th><p th:text="#{list.table.name5}">死亡</p></th>
  19.     </tr>
  20.     </thead>
  21.     <tbody>
  22.     <tr th:each="bean:${beanList}">
  23.         <td th:text="${bean.area}">name</td>
  24.         <td th:text="${bean.nowConfirm}">nowConfirm</td>
  25.         <td th:text="${bean.confirm}">confirm</td>
  26.         <td th:text="${bean.heal}">heal</td>
  27.         <td th:text="${bean.dead}">dead</td>
  28.     </tr>
  29.     </tbody>
  30. </table>
  31. </body>
  32. </html>
复制代码

当我们运行项目后,通过浏览器更改语言,就可以切换成不同语种的显示了。

以chrome为例,将中文置顶,则显示中文,将英语(美国)置顶,则显示英文,这里要注意,如果没有英语(美国)这个语言,可以在底下的添加语言中,先搜索后添加。

那是如何实现切换的呢,当我们调出控制台,比对两笔请求的http,可以发现请求头中Accept-Language参数是不同的,请求中文时以zh-CN开头,请求英文时以en-US开头,如果你对其他语种感兴趣,也可以看一下其他语种的简称。

但是通过浏览器切换仍有些麻烦,所以我们尝试在页面中添加切换按钮

当我们设置了参数lan用来区分不同语种时,需要使用一个处理器来接收语种参数

然后将处理器注入到spring容器中

同时增加一个list_zh_CN.properties文件,声明各字段的中文值
再次启动项目,就可在页面中进行中英文切换了。

十二、Redis的使用

三大客户端框架: Jedis Redission Lettuce

其中spring-data-redis 是将redis整合在spring中使用的jar包

在springboot2.0以后的版本 将原本的jedis升级成Lettuce 而本质上是一种连接池的封装

redis数据的存储,可以在项目启动时存储,另外可以在请求第一次被调用时存储(懒加载)
请求 -》 redis(存在 -》 直接返回,不存在 -》 mysql中查询 -》 存储到redis中 -》 返回)
-》 mysql(存在 ,不存在 -》 发送http请求 -》 数据清洗和计算后存储 -》 返回)

以折线图数据为例

在处理数据的过程中,有三种数据形态

    1)url直接返回的原始数据
    2)第一次解析后处理的 List<GraphBean>
    3) echarts的直观需要的三个list, 一个对应x轴,两个对应y轴

第一种数据重要,但一般不放在redis中存储,甚至不放在mysql中。


作者:步尔斯特
来源:https://blog.csdn.net/CSDN_SAVIOR/article/details/123948991


最新经典文章,欢迎关注公众号


已有(1)人评论

跳转到指定楼层
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条