文本文件换行符识别/编码识别和转换
以编码读取文件,内容预览(1000字节内):
若预览出现乱码,则下方的信息不可靠。
改变换行符为并
保存为 UTF-8 编码的新文件。拿到一个TXT文件,对其进行换行处理时出错,怀疑是换行符的问题,经测试的确如此。对于多平台交换的文本文件如何直观的检查换行符?这个页面即是以此为初衷设计。
文件在本地读取和识别,无上传操作,方便快捷,处理能力取决于你的计算机。为方便扩展测试,不限制文件类型和大小,但文件过大可能致浏览器无响应。
对于文本文件,可以修改换行符并保存为 UTF-8 编码的新文件。
不同平台的换行区别:
- Windows(回车换行 CRLF):\r\n
- Linux(换行 LF):\n
- Mac(回车 CR):\r
此页面也可用作文本文件编码识别和转换。
文本文件编码识别:程序在读取文本文件时,会通过字节顺序标记(BOM)、字节检测等方式,尝试标记正确的编码并预览。若未成功,预览文字将出现乱码,用户可通过切换编码直至文本内容正常显示,即可确定文件编码。
文本文件编码转换:此页面可对文本文件编码进行单向转换,即将当前系统无法读取的编码转换成UTF-8编码文件。例如在简体中文系统上,将BIG5编码的文本文件转换成UTF-8编码,从而正常显示。操作方法:读取文本文件并预览正常后,在“保存为 UTF-8 编码的新文件”处点击确定。