访问日志格式化器(Apache / Nginx)
指导
访问日志格式化器(Apache / Nginx)
粘贴原始的Apache或Nginx访问日志行,立即将其转换为结构化、可排序的表格。访问日志格式器会检测每行日志是采用通用日志格式(CLF)还是合并日志格式(Apache默认格式),然后将每条记录拆分为清晰的列:IP地址、日期/时间、请求方法、路径、状态码、字节数、referrer和用户代理。可通过状态码分组进行过滤,点击任意列标题即可排序,仅导出你关心的行作为CSV文件。
如何使用
- 将你的原始访问日志行粘贴到输入框中,或上传日志文件。
- 离开 日志格式 在自动检测模式下,或如果服务器使用固定格式,则可将其固定为CLF或合并格式。
- 使用 状态码过滤 选择下拉菜单以缩小结果到特定状态码分组(例如, 4xx客户端错误 在查找损坏链接时使用)。
- 点击任意列标题以按IP地址、日期/时间、状态码、字节数或其他字段排序。
- 点击 Download CSV 以将当前可见的行保存,用于在电子表格中进一步分析。
特征
- 自动检测CLF和合并格式 – 无需预先了解日志格式;自动识别Apache和Nginx的默认格式。
- 可排序列 – 点击任一列标题即可按IP地址、日期、状态码、响应大小等字段排序。
- 状态码过滤器 – 快速筛选出2xx成功、3xx重定向、4xx客户端错误或5xx服务器错误的请求。
- 状态码颜色高亮 – 状态码以颜色标识,异常情况一目了然。
- 过滤后行的CSV导出 – 下载你看到的精确内容,可直接导入Excel、Sheets或Pandas。
- 文件上传支持 – 可通过拖放方式直接拖入日志文件,而无需粘贴日志行。
- 完全在浏览器中运行 – 日志不会离开页面,因此敏感的IP地址和请求路径将保留在本地。
常问问题
-
通用日志格式(CLF)和组合日志格式的区别是什么?
通用日志格式记录了客户端IP、RFC 1413身份标识、已认证用户、请求时间戳、请求行、HTTP状态码和响应大小(字节)。组合日志格式在末尾增加了两个额外的引号字段:来源地址头和用户代理头。Apache的默认访问日志使用组合格式;Nginx默认使用类似格式,称为‘main’,也兼容组合格式。
-
为什么访问日志条目有时会显示为破折号而不是实际值?
访问日志中的单个破折号('-')表示该字段不可用。RFC 1413身份标识几乎总是为破折号,因为该协议几乎未被使用,而未认证请求的已认证用户则为破折号。当客户端未发送来源地址或用户代理头时,来源地址和用户代理头为破折号。对于返回无内容体的请求(如304 Not Modified),响应大小为破折号。
-
HTTP状态码组(1xx、2xx、3xx、4xx、5xx)的含义是什么?
每个数字类别表示一种响应类型。1xx为信息类(在访问日志中很少见),2xx为成功,3xx为重定向,4xx表示客户端错误(如资源缺失或未授权请求),5xx表示服务器错误(如内部异常或上游故障)。按组过滤可快速发现损坏的链接(4xx)或后端事件(5xx)。
-
为什么访问日志的时间戳被方括号包裹并带有类似 -0700 的偏移量?
通用日志格式的时间戳使用 strftime 模式 '[day/month/year:hour:minute:second zone]',其中 zone 是服务器相对于UTC的偏移量。方括号和尾随偏移量是格式本身的一部分,因此解析器必须将整个括号表达式视为一个字段。存储偏移量意味着即使服务器之后更改时区,时间戳也可以被无歧义地解释。
