HTML Parser
JavaのHTML Parser でいまだにしっくりくるライブラリを見つけられないのですが、私がいくつか試したものを紹介します。
JTidy
特にXHTML形式のファイルの解析で威力を発揮します。
HTMLEditorKit:
Swingに付属しているものです。個人的にはSwingのライブラリをHTMLの解析の目的で使うのはどうかなあと感じています。
NekoHTML
残念ながらまだ試していませんが、これが使いやすそうです。機会があればBlogに書こうと思います。
StackOveflow のJava HTML Parsingの議論が参考になりそうです。
Htm Parser
jsoup
コメント