信息

微信公众号推文数据采集 - 油猴脚本

前言

因为公司平时需要运营记录微信公众号推文的阅读数、点赞数、评论数,所以经常会浪费大把时间去统计,所以小杰为了帮助她人,就利用工作闲暇之余制作了这一款油猴脚本,可以抓取微信公众号平台推文的文章数据,并制作成execl报表并下载。

脚本地址

在线安装

教程

因为小杰也是萌新,所以参考网上的教程再加上自己平时学的一些js,才把数据拿到手,如果你也想制作属于自己的油猴脚本,可以参考《简单的油猴脚本编写教程

此次制作无非就是使用jquery的选择器拿到html内容,原理相对简单,但是打包成报表的时候搞了很久,但是幸好在百度找到一篇《HTML table导出到Excel中的解决办法

才完成了最后的报表导出功能。

代码

 

// ==UserScript==
// @icon            https://res.wx.qq.com/a/wx_fed/assets/res/OTE0YTAw.png
// @name            微信公众号数据采集
// @namespace       [url=https://www.youngxj.cn]杨小杰博客[/url]
// @author          Youngxj
// @description     获取微信公众号文章发布的文章标题、阅读数、点赞数、评论数,并下载成表格
// @match           *://mp.weixin.qq.com/cgi-bin/home*
// @require         https://cdn.bootcss.com/jquery/1.8.3/jquery.min.js
// @version         0.0.3
// @grant           GM_addStyle
// ==/UserScript==
(function() {
    'use strict';
    // 脚本制作参考教程:https://blog.csdn.net/weixin_30635053/article/details/95395672
    //与元数据块中的@grant值相对应,功能是生成一个style样式
    GM_addStyle('#down_wixin_btn{color:#fa7d3c;}');
    //视频下载按钮的html代码
    var down_btn_html = '<div class="weui-desktop-online-faq__switch_content" id="down_wixin_btn"> <div class="text">获取数据</div>  </div>';
    //将以上拼接的html代码插入到网页里的ul标签中
    var ul_tag = $(".weui-desktop-online-faq__switch_content");
    if (ul_tag) {
        ul_tag.append(down_btn_html);
    }
    // 插入div块
    var textar = '<div class="weixin_data_textarea" style="display:none;"></div>';
    $('body').append(textar);
    var timer;
    var WxTool = {
        // 把页面的表格转化为excel下载下来
        // 参考链接:https://www.cnblogs.com/anniey/p/7738278.html
        getExplorer: function() {
            //获取浏览器
            var explorer = window.navigator.userAgent;
            if (explorer.indexOf("MSIE") >= 0 || (explorer.indexOf("Windows NT 6.1;") >= 0 && explorer.indexOf("Trident/7.0;") >= 0)) {
                return 'ie';
            } else if (explorer.indexOf("Firefox") >= 0) {
                return 'Firefox';
            } else if (explorer.indexOf("Chrome") >= 0) {
                return 'Chrome';
            } else if (explorer.indexOf("Opera") >= 0) {
                return 'Opera';
            } else if (explorer.indexOf("Safari") >= 0) {
                return 'Safari';
            }
        },
        excels: function(table) {
            if (WxTool.getExplorer() == 'ie') {
                var curTbl = document.getElementById(table);
                var oXl = new ActiveXObject("Excel.Application"); //创建AX对象excel 
                var oWB = oXL.Workbooks.Add(); //获取workbook对象
                var xlsheet = oWB.Worksheets(1); //激活当前sheet
                var sel = document.body.createTextRange();
                sel.moveToElementText(curTbl); //把表格中的内容移到TextRange中 
                sel.select; //全选TextRange中内容
                sel.execCommand("Copy"); //复制TextRange中内容
                xlsheet.Paste(); //粘贴到活动的EXCEL中
                oXL.Visible = true; //设置excel可见属性
                try {
                    var filename = oXL.Application.GetSaveAsFilename("Excel.xls", "Excel Spreadsheets (*.xls), *.xls");
                } catch (e) {
                    window.print("Nested catch caught " + e);
                } finally {
                    oWB.SaveAs(filename);
                    oWB.Close(savechanges = false);
                    oXL.Quit();
                    oXL = null; //结束excel进程,退出完成
                    timer = window.setInterval("WxTool.Cleanup();", 1);
                }
            } else {
                WxTool.tableToExcel("weixin_data_table");
            }
        },
        Cleanup: function() {
            window.clearInterval(timer);
            CollectGarbage(); //CollectGarbage,是IE的一个特有属性,用于释放内存的
        },
        base64: function(s) {
            return window.btoa(unescape(encodeURIComponent(s)))
        },
        format: function(s, c) {
            return s.replace(/{(\w+)}/g, function(m, p) {
                return c[p];
            })
        },
        tableToExcel: function() {
            return WxTool.zzzz("weixin_data_table", '微信公众号数据采集');
        },
        zzzz: function(table, name) {
            var uri = 'data:application/vnd.ms-excel;base64,',
                template = '<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns="http://www.w3.org/TR/REC-html40"><head><!--[if gte mso 9]><xml><x:ExcelWorkbook><x:ExcelWorksheets><x:ExcelWorksheet><x:Name>{worksheet}</x:Name><x:WorksheetOptions><x:DisplayGridlines/></x:WorksheetOptions></x:ExcelWorksheet></x:ExcelWorksheets></x:ExcelWorkbook></xml><![endif]--></head><body><table>{table}</table></body></html>';
            if (!table.nodeType) table = document.getElementById(table);
            var ctx = {
                worksheet: name || 'Worksheet',
                table: table.innerHTML
            };
            window.location.href = uri + WxTool.base64(WxTool.format(template, ctx))
        }
    };
    $(function() {
        //执行下载按钮的单击事件并调用下载函数
        $("#down_wixin_btn").click(function() {
        	// 微信公众号目前的数据节点是这样的,微信公众号平台更新可能会导致节点改变,稍微改变即可
        	var title = $('.weui-desktop-mass__item .weui-desktop-mass-appmsg .weui-desktop-mass-appmsg__title span');
	        var yuedu = $('.weui-desktop-mass__item .appmsg-view span');
	        var dianzan = $('.weui-desktop-mass__item .appmsg-haokan span');
	        var pinglun = $('.weui-desktop-mass__item .js_comment_info .weui-desktop-link');
            var arrTime = new Array();
            var arrTitle = new Array();
            var arrYuedu = new Array();
            var arrDianzan = new Array();
            var arrPinglun = new Array();
            $.each(title, function(index, val) {
                var times = $(val).parent().parent().parent().parent().parent().prev();
                var timess = $(times).children('em').html();
                arrTime.push(timess);
                arrTitle.push($(val).html());
            });
            $.each(yuedu, function(index, val) {
                arrYuedu.push($(val).html());
            });
            $.each(dianzan, function(index, val) {
                arrDianzan.push($(val).html());
            });
            $.each(pinglun, function(index, val) {
                arrPinglun.push($(val).html());
            });
            // 组装数据
            var newHtml = '';
            $.each(arrTitle, function(index, val) {
                newHtml += '<tr><td>' + arrTime[index] + '</td><td>' + arrTitle[index] + '</td><td>' + arrYuedu[index] + '</td><td>' + arrDianzan[index] + '</td><td>' + arrPinglun[index] + '</td></tr>';
            });
            // 拼接table
            var textDataStart = '<table class="weixin_data_table" id="weixin_data_table">\
             <thead>\
                 <tr>\
                 	<th class="time">时间</th>\
                     <th class="title">标题</th>\
                     <th class="read_num">阅读数</th>\
                     <th class="dianzan_num">点赞数</th>\
                     <th class="pinglun_num">评论数</th>\
                 </tr>\
             </thead>\
             <tbody>';
            var textData = $('#weixin_data').val();
            var textDateEnd = '</tbody></table>';
            $('.weixin_data_textarea').html(textDataStart + textData + newHtml + textDateEnd);
            WxTool.excels('weixin_data_table');
        });
    });
})();

 

预览

微信截图_20200114171503 (1).jpg

数据截图.jpg

 

来自杨小杰

🌟-阅读剩余-🌟
版权声明 1、本网站名称:安鹿轩
2、本站永久网址:https://www.anlu1314.com
3、本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系在本站私信站长进行删除处理。
4、本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
6、本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。

THE END