htmlファイルのrest変換がなんとかうまくいった
htmlで書かれたファイルを rest に変換したくなりました。Sphinxを触っているとたぶん誰もが一度は通る道な気がします。しかし Sphinx の 逆引き辞典 や クックブックには無かったのでググった。
いくつか試してみた。
うまくいった方法
codeigniter-jp/html2sphinx · GitHub の html2rest.py を使わせてもらいました。
$ git clone https://github.com/codeigniter-jp/html2sphinx ~/work/html2sphinx $ pip install BeautifulSoup $ python ~/work/html2sphinx/html2rest.py Manual.html > Manual.rst
追記
- imgタグは変換されないようだ\(^o^)/
- 一部文字化けだったり、ずれていたりと手直しした
うまくいかなかった
- html2rst.py は、日本語が文字化け。入力ファイルは BOM無し UTF-8 だが。
- http://pypi.python.org/pypi/python-creole/ に同梱されている html2rest は関数で呼び出す形だったため見送り
時間がなくてあんまり調べてないので、もっとスマートな方法やメジャーな方法あったら教えてください。