2026/4/6 12:55:31
网站建设
项目流程
东莞做网站的联系电话,徐州哪里做网站,互联网医院运营方案,深圳网站建设公司613Part1 前言 大家好#xff0c;我是ABC_123。最近我在家里集中精力#xff0c;把多年前写的 Web 日志分析工具重新梳理并完善一下。该工具从 2017 年开始编写#xff0c;期间一直断断续续地修改和新增功能#xff0c;最近终于抽出时间系统性地更新优化#xff0c;整理出了一…Part1 前言大家好我是ABC_123。最近我在家里集中精力把多年前写的 Web 日志分析工具重新梳理并完善一下。该工具从 2017 年开始编写期间一直断断续续地修改和新增功能最近终于抽出时间系统性地更新优化整理出了一个相对完整可用的版本分享给大家使用。文末有下载地址如果在使用过程中有任何建议、遇到 Bug 欢迎反馈。Part2 技术研究过程首先看一下软件界面该界面可以指定日志所在目录然后提供了部分选项点击分析日志按钮即可开始分析日志并生成日志分析报告。界面支持配置默认主机名、开启自动识别日志类型并可按需配置日志分片大小默认300MB与日志编码如 GB2312以适配不同格式与大体量日志文件的处理需求。在分析内容方面工具支持多种筛选策略可选择分析全部URL、仅分析带参数或不带参数的URL同时可按资源类型过滤例如分析全部扩展名URL、仅分析动态URL过滤图片、html、js、css或仅分析指定后缀如php/asp/jsp。此外状态码统计也支持全量分析、仅分析200状态码或指定状态码如404,502便于针对异常访问进行定位。分析完成后该软件会在当前程序的 result 目录下生成一份 HTML 可视化报告。报告首页以仪表盘形式汇总 Web日志的整体态势左侧展示漏洞攻击类型分布饼图下方提供攻击目标雷达图中间区域集中呈现Web日志的核心指标包括总访问数、PV/UV、独立 IP 数、总消耗流量、漏洞攻击数、攻击 IP 数、攻击种类、错误访问数及日志文件大小等底部通过攻击曲线图展示攻击随时间的变化趋势便于快速定位风险高发时段并开展溯源与处置。全站请求数量曲线图用于展示在统计时间范围内各时间点的请求量变化情况。通过曲线的波动可以快速识别访问高峰与低谷判断是否存在突发流量、集中扫描或异常请求激增等现象为定位异常时段提供依据。全站请求流量曲线图用于展示全站流量消耗随时间的变化趋势单位以 GB 计。该图能够直观反映带宽占用情况辅助判断大流量下载、资源盗刷、恶意刷接口或攻击引起的流量异常从而为后续限流、封禁与资源调度提供参考。状态码分析以表格 环形图展示 2xx / 3xx / 4xx / 5xx 的次数与占比用于快速判断访问是否正常、错误请求是否集中。攻击行为统计汇总各类攻击行为及命中次数如 SQL 注入、XSS、WebShell、SSRF/文件包含、框架漏洞探测等便于定位主要风险点。报告还提供了攻击来源与恶意 IP 统计模块攻击 IP 分布按国家/地区汇总攻击来源及数量便于快速识别高风险区域。恶意 IP 列表展示攻击次数最高的 IP并标注归属地、攻击类型及占比用于溯源分析与封禁处置。该页面为 IP流量分析TOP200用于统计访问量和带宽消耗最高的 IP。 表格按 IP展示其访问次数、访问占比、归属国家/地区、流量消耗及流量占比便于快速定位高频访问源和异常大流量 IP为限流、封禁和溯源提供依据。该页面为国外IP流量分析TOP200用于筛选并统计来自境外的高频访问源。 报告中展示国外 IP 的访问次数、访问占比、归属地区、流量消耗及流量占比便于识别异常境外流量、可疑扫描来源并为封禁策略与访问控制提供参考。静态资源POST请求访问分析TOP200统计对静态资源发起 POST 请求的 URL、访问次数、流量占比及响应码。由于静态资源通常不应使用 POST 方法该模块可用于识别异常请求或潜在攻击尝试。漏洞攻击列表汇总检测到的漏洞利用行为如 Nginx 解析漏洞 TOP10展示对应的 Host、攻击 IP、攻击 URL、命中次数、响应码与时间便于快速定位漏洞探测与攻击来源。该页面主要用于统计站点的热门访问资源包含两类 TOP200 排行页面访问分析TOP200按页面 URL 统计访问次数、访问占比、独立 IP 数、流量消耗及响应码用于识别访问最集中的业务入口和高流量页面。静态资源访问分析TOP200统计图片、JS、CSS 等静态资源的访问次数与流量占比便于发现高消耗资源及异常访问情况。该模块为死链404访问分析TOP200用于统计返回 404 Not Found 的高频 URL。表格展示每个死链的访问次数、独立 IP 数、流量消耗及占比便于排查无效链接、资源缺失或被扫描探测的路径并为修复跳转、补全资源或封禁恶意请求提供依据。该模块为访问来源URL分析TOP200用于统计 Referer来源地址的访问情况。 表格展示各来源 URL 的访问次数、访问占比、独立 IP 数及引流页面数便于识别主要入口来源、异常外链引流或可疑跳转来源。搜索引擎爬虫分析统计来自 Baidu、Google、Bing、Sogou 等搜索引擎爬虫的访问次数、占比及流量消耗用于评估爬虫抓取强度与带宽影响。搜索关键词分析TOP200汇总搜索引擎带来的关键词访问情况展示关键词的出现次数、独立 IP、首次/最后出现时间及搜索来源链接用于分析主要检索入口与流量来源。该模块为地域访问分布分析用于统计不同国家/地区的访问情况。 表格展示各地区的访问用户数、用户占比、访问总次数及流量总量便于识别主要访问来源区域并辅助发现异常地域流量或可疑集中访问行为。该模块为操作系统使用分析用于统计访客使用的终端系统分布。 表格展示各操作系统的访问用户数、占比、访问总次数与流量消耗并通过柱状条直观对比占比情况便于了解主流访问终端及异常系统访问特征。该模块为浏览器使用情况分析用于统计访客浏览器类型分布。 表格展示各浏览器的访问用户数、占比、访问总次数及流量消耗并以柱状条对比浏览器占比便于了解主流访问终端及可疑 UA如 Unknown访问情况。Part3 总结1. 工具支持一键导入日志文件/目录自动识别日志类型并可配置主机名、编码与分片大小适配大体量日志快速解析。2. 提供多维筛选功能可按 URL 类型全量/带参/不带参、资源类型动态/指定后缀及状态码范围进行精确分析便于聚焦异常行为。3. 分析过程可视化展示实时输出 GeoIP 初始化、分片处理进度与资源占用情况确保分析过程透明可控方便排障与溯源。4. 关注公众号希潭实验室回复关键字log即可得到软件的下载地址。大家有好的建议欢迎给我留言。为了便于技术交流现已建立微信群希水涵-信安技术交流群欢迎您的加入。公众号专注于网络安全技术分享包括APT事件分析、红队攻防、蓝队分析、渗透测试、代码审计等每周一篇99%原创敬请关注。Contact me: 0day123abc#gmail.comOR 2332887682#qq.com(replace # with )