FC2ブログ

1日3タックルを目指して頑張ります。 ロリ巨乳が大好きです。 > 今日の3タックルTopへ

Top /  2010年11月

html を mobi に変換する

 2010/11/27 (Sat) -  カテゴリ:  若干エンジニアらしい話 »  Python

思い立ったが吉日ってことで携帯小説をPCにダウンロードして、mobi 形式(kindle で読める形式)に変換してみた。念のため E★エブリスタの会員規約を調べてみたけど、特にローカルに保存しちゃダメよ的な記述がなかったので「私的利用だから許してください。」っていう言い訳でローカルに保存させて頂いた。(まぁ厳密にはブラウザでwebページを開いた時点でローカルに保存されちゃってるわけだが)

という理由により Python でサクッと書いたダウンロードツールのソースを全部公開するのも憚られるので最低限動く部分だけ…。にしてもやっぱ Python って便利だよね。

>>> import urllib2
>>> import re
>>> regexp = re.compile(r'<img src="http://estar.jp/i/dot.gif" height="3" width="1" alt=""><br>')
>>> f = urllib2.urlopen('http://estar.jp/.pc/_novel_page?page=2&w=10741090')
>>> print regexp.split(f.read())[1] # とりあえずこの部分をファイルに吐き出せばおk
>>> f.close()

後は URL の page の部分を変えながらごにょごにょすればサクッと全ページのダウンロードが完了する。適当な wait を入れたり、相手のサーバが返してくるステータスコードをチェックして適切にさばいてあげたりしないと「岡崎市立中央図書館の大量アクセス事件w」みたいなことになるかもしれないから気をつけてね。

んで、首尾よくローカルに保存できたら、スタイルとかをちょっぴり整えて html ファイルを作り KindleGen を使って html → mobi の変換をする。KindleGen は Amazon が公式に配ってるツールだから信頼性は抜群だ。ちなみに、変換のしかたは簡単で Windows 版の場合は zip を ダウンロードして適当なディレクトリに解凍したら、変換したい html ファイルを kindlegen.exe に Drag & Drop すれば html ファイルと同じパスに mobi ファイルができあがる。このやり方で mobi ファイルができなかったらどっかでエラーが出ているはずなので、コマンドプロンプトで (引数にhtmlファイルを指定して) kindlegen.exe を実行するとどんなエラーが出ているかがわかる。

これで電波の届かない地下鉄とかでも快適に読むことができるな。そしてなにより携帯よりも kindle のほうが読みやすくて素敵

20101127.png

スポンサーサイト



 | トップへ | 
最新記事
カテゴリ
最新コメント
最新トラックバック
月別アーカイブ
カウンタ
_
カレンダー
10 | 2010/11 | 12
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 - - - -
これはやべぇ

インターネッツの設定をしてあげたついでに、接続確認と称してこのブログを開いたら、気になるあの娘が検索したアイテムがwww

万が一アダルトグッズが表示されたりしたらと思うと股間が熱くなるな。

とか妄想してたけど、インターネッツの設定をしてあげた直後に検索の履歴が残ってるわけないか
(´・ω・`)
にしても使い方によってはこの機能は凶悪だな。

プロフィール

タックル

Author:タックル
三度のメシより大ライスが好きなエンジニアです。
焼肉屋に行ったら最初の一杯は大ライスで乾杯! 全然関係ないけど食堂のカレーなら4杯は軽いよ。

ちなみにロリ巨乳は大ライスより好き!

プライベートでタックルされてくれるロリ巨乳のお友達を24時間365日募集中です。

エントリーの内容はタックルの日々の生活について多少脚色しながら面白おかしく書いている限りなくノンフィクションに近いフィクションです。

嘘を嘘と見抜けない人は(ry

Webサービス
フィードメーター - 今日の3タックル あわせて読みたいブログパーツ
タックル会
個人的なリンク