主要目的:净化文本格式
1. 清除隐藏的格式字符
当从网页、PDF、Word文档等复制代码时,经常会携带:
不可见的格式标记
特殊的引号字符(“ ” 而不是 " ")
不同的换行符(\r\n vs \n)
零宽空格、特殊Unicode字符
2. 避免编码问题
网页可能使用UTF-8 with BOM
源代码文件通常需要纯ASCII或UTF-8 without BOM
Notepad可以保存为纯文本格式
实际问题的例子
从网页复制的代码可能包含:
#include <stdio.h> // 网页可能使用特殊的引号或空格 int main() { printf("Hello World"); // 引号可能是弯曲的“ ” return 0; }
经过Notepad净化后:
#include <stdio.h> int main() { printf("Hello World"); // 标准的ASCII引号 return 0; }