classics.

2012/12/21 Friflickr

tweets.zip を epub にするためのメモ

  • 構成
    • TOC は大見出しで年別、その中で中見出しで月別、小見出しで日別
  • URL
    • status.urls, status.expanded_url とかのプロパティが実装されたのは最近 → ある場合とない場合で自動リンク処理を分ける
    • 画像共有サービスのURL or 画像ファイルのリンクならサムネイル埋め込みたいので短縮されていない必要がある
  • マークアップ
    • epubでどこまでレイアウトいじれるのか分かっていない
    • 横書き
    • 電子書籍としての最適な表示形式とは
    • ブラウザ付きの端末そこそこ普及しているので permalink, favorite などのリンクも張る

週末にやる気が残っていたらとりあえず自分専用の物くらいは作りたい。

2012/02/13 Monflickr

自炊ブログ

image

ハヤシライスを自炊しつつzipも炊いた。帯付きでスキャンの成功率上がってきた。

2012/01/11 Wedflickr

Webページを電子書籍化するツールいろいろ

色々試してきたし、まとめてみる。

Kindlenap

URLを投げるだけ。本文領域のみ取得。AutoPagerize対応。

sendkindle

自分が作ったの。URLを投げるだけ。画像とかもまとめてpavukで取得してページまるごとKindleに投げる。

wkhtmltopdf

webkitでレンダリングしてpdfに書きだす。

ebook-convert

Calibreの一部。RSSフィード等から生成。サイト用設定ファイル必要。ニュースやブログの定期自動配信に適してる。

webiblo

XPath等で細く設定可能(というか必須?)。インデックスも生成。複数ページあり、更新終了したコンテンツに適してそう。

(ついでに)zip2mobi

自炊した画像のzipファイルをmobiにする。

2011/07/24 Sunflickr

Evernoteからエクスポートした複数のHTMLファイルをePubとかKindle用mobiにする

個人的に必要になって出来たのでメモ。複数のページをエクスポートするとリンク付きのインデックスとかできて便利なので。適当にスクリプト書いたりするのもいい気がするけど、XML編集がだるかったのでGUIメインでやってみた。

追記: テキストデータ以外に画像とかを含む場合を試していないのでその辺はよくわかりません

まずEvernoteからエクスポートします。
export from evernote1
export from evernote2
こんな感じで。普通ですね

次にSigilをおもろに立ち上げます。入ってなかったら以下から入れましょう。
sigil - A WYSIWYG ebook editor. - Google Project Hosting

次にHTMLファイルをぶっこみます。新規作成の際にデフォルトであるXHTMLファイルを先には削除できないので、必要なHTMLファイルを入れてからいらないXHTMLファイルを削除する。
Sigil
Sigil
こんな感じで、index.htmlは一番上(その方が便利)で、他も順番指定したければ適当に並べ替える。

Tools>Meta Edotorからメタデータも適切に編集する。しないとエラーになるので。それで、ePubとしてエクスポート。
Sigil - Meta Editor

で、ePubからmobiにするのは単純にkindlegen叩くだけで、kindlegenもePubもカレントディレクトリにあるとすると、

$ ./kindlegen てすと.pub
ですかね。あとはメールとかで適当にKindleに転送する。

やっぱインデックスページを渡したら相対パスのページ諸々取り込んでいい感じに仕上げてくれるePub生成スクリプトほしいところですね。既にありそうな気もするけど。

2010/11/22 Monflickr

zip2mobi 作った

http://oquno.com/log/eid2367.html の続き
昨日楽に作れそうなコードを見つけたので作って、自宅ライブラリのzipからKindleだけで落とせるようになったので一応公開しておきます。動けばいいかなという感じなのでコードは適当です。

大体の処理はzip2epubを使う https://gist.github.com/356303
それにkindlegenを組み合わせて、文字コードがなんか上手くいないのを無理矢理消したり、書籍名設定したりrmagickで横長画像を270°回転させたりちょくちょくいじったのが zip2mobi です。 https://gist.github.com/709699
なので、epubも一緒に作成される。使う場合は作成されるパスとか適当に弄ってみてください。

自分の環境では、apacheのmod_autoindexのHeaderNameで設定したファイルにzipへのリンクにmobiを作成するリンクも付けるJavaScriptを書いて、そのリンクを踏むとCGI経由でTask Spoolerにzip2mobiの処理を投げて、だいたい2分くらいでmobiができる感じです。出来上がったmobiは今のところ特に問題ない感じです。

autoindex

そんなわけで、Kindle買いましょう

2010/10/30 Satflickr

連番画像から .mobi への変換をUnixでしたい

自宅サーバーからKindle本体で落とすのはmobiとかしかできななくて、今は必要な際にはWindowsのデスクトップマシンでChainLPを使って作成していて、結構GUIで時間がかかる感じなので、ここはひとつサーバーサイドでなんとかしたい。

http://oquno.com/log/eid2361.html
これと組み合わせてうまくやれば落としたい時に変換するとかもできそうだし(Kindleのブラウザから変換するファイルを選ぶUIは別に必要そうだけど)。

で、さすがに広い世界だからzip2mobiとかimg2mobiとか作って公開してる人いるだろうと思って探してみたのだけれどいないようなので、自作するしかない様子。まあ閲覧ならzipの方がいいしファイルサイズも無駄に大きくならないのでわざわざmobiにすることはないのですが。

処理内容としては、

  1. % zip2mobi misawa.zip
  2. zip展開
  3. 展開した中にある画像ファイルを再帰的に取得、ファイル名でソート
  4. kindlegen用のhtmlとかなにやら作る
  5. kindlegenに投げる
  6. misawa.mobi 完成

みたいな感じですかね。4がめんどそうなのでまだ手をつけてないのだけど、できたら公開するのでその前に他の人が作って公開してくれるといいと思います。

このへん参考にする

あと、Kindle持ってない人は買いましょう
</a>

2010/10/29 Friflickr

Amazon Kindleを買いましょう

Kindleを買って一月半ほど経って、知り合いには布教しまくっているのですが、オンラインでもそろそろまともなレビューを書いておこうということで、Amazon.comのアフィリエイトアカウントも作成したことだし、紹介などしておきます。

まずKindleが何かというと、E Inkモノクロ16階調ディスプレイを搭載した電子書籍リーダーです。今Amazon.comで新品で普通に変えるのは、Kindle 3と呼ばれる一番新しいバージョンと、Kindle DXと呼ばれる少し古いけど画面が大きいバージョンです。日本から買うならAmazon.comで買うのが普通ですが、英語苦手ならヤフオクなんか覗いてみるといいんじゃないですかね。

↑こんな感じ。Kindle 3の方は、Wi-Fiが使える版と3G回線+Wi-Fiが使える版があって、Kindle DXは3G回線のみ利用できます。また、日本だとDoCoMoとSoftBank Mobileの回線を使うようですが、Amazonがローミングやらなんやらしているらしく、3G回線の契約は別途必要ありません。自分はろくに調べずに3GのSIMから自分で用意しないといけないのかと思ってWi-Fiのみの版を買ってしまいました。Kindle DXはあまり触ったことないのですが、ハードウェアは画面解像度もあっていいけれどファームウェア対応が遅れているのかやる気がないのか、日本語のフォントが入っていなかったりして今後のサポートも心配な感じです。その他は公式の比較表などを見れば大体わかると思います。

Kindle Comparison

実験的機能で、モノクロだし日本語入力も使えませんが、最新の3系統ならばWebkitベースのWebブラウザが載っていて、日本語のページも大体レンダリング問題ない程度には動くので、出先で3G回線使ってインターネットも軽くできるしWi-Fiのみと$50程度の差なので、個人的にはKindle 3G+WiFiが一番おすすめです。一番大事な注意点としては、円高のうちに買うのを心がけましょう。

自分の場合はほぼ常時Kindleを携帯して、教科書とかも買って即日裁断&スキャン&ゴーゴミ箱といった具合に、本は持たないようになりました(元からあまり持ち歩いてはいなかったけれど)。OCRはソフトは高いし完全にテキストにするには手間もかかるので、Kindleだと日本語で検索できるわけでもないし諦めました。Kindle 3だと携帯コストが新書一冊程度と同程度なので、割と気軽に携帯できます。気軽に携帯しすぎて、カバーなど付けずに鞄の中で圧力に耐えさせたりと適当に扱っていたらキーボードの印字がかすれてきたので、気にする人は気をつけたほうがいいかもしれない。一応ディスプレイが割れた事例とかはあるらしいけれど、腰くらいの高さからは頻繁に落としている自分の場合だと、裏の蓋っぽい部分が一回外れかけた(簡単に戻せた)くらいでさすがApple製品とは違うぜといったところですね。

あと、USBにつながないとファイル操作が十分にできないのが大きな不満点なのですが、sftpサーバー化するハックがあってだいぶ快適そうなのですごいやりたいのだけれど、既にKindleがライフラインになっていておかしくなって初期化もできなくなったら困るので思いとどまっている。アフィリエイト報酬でもう一枚買えたらやりたい。

2010/10/14 Thuflickr

Kindleで自宅から電子書籍を落とせるようにした

ちょこっとやったのでメモ。
自宅のサーバーではsamba(+hamachi)で諸々のファイルを出先でも扱えるようにしているのですが、大学のKUINS3からだとうまくhamachiがつながらず、OpenVPNセットアップするのちょっとめんどいなということで、どうせ自宅から引っ張るだけだしsambaの中身webでみえればいいやということで認証をつけてhttpで見れるようにしたのがきっかけでした。pdfやzipはまだできないけれど、確かmobiならKindleのブラウザから直接落とせたよなと思い、httpd.confなりapach2.confなりmime.confなりに
AddType application/x-mobipocket-ebook .mobi
と追加してapacheをリロードして、KindleのブラウザからアクセスしたらうまくKindleのライブラリに追加できました。Options Indexes を有効にしてディレクトリ丸見えにするだけでファイルビューワーみたいの作らなくてもいいので楽ですね。書籍の削除はKindle本体だけでもできるので、mobiだけならばいちいちUSBを刺さなくてもよくなって便利です。Opera Unite とか使っても似たようなことできるかもしれない。

2010/10/09 Satflickr

自炊/Kindle関連で使えそうなツール

Windowsのデスクトップ環境で試行錯誤しているので、メモしておく。このへんを見ておくのもいいかも。
そのうちこのようにサーバー等で処理させるようにもしてみたいところ。

IrfanView32

スキャンしたままの画像だと白であるべきところが紙の色になっていたりするので、ファイルの一括変換でコントラストを上げて綺麗に見えるようにする。
http://www8.plala.or.jp/kusutaku/iview/

eTilTran

主に傾き補正とついでにリサイズ。自動で傾きを解析してくれる。裁断が斜めになったせいかスキャンした画像が傾くことが多々あるのでよく使う。
http://no722.cocolog-nifty.com/blog/etiltran/

ChainLP

余白飛ばしてKindleに最適化された(mobi|zip|pdf)を作ったり。
http://no722.cocolog-nifty.com/blog/chainlp/

PageSplitter

見開き画像を真ん中で分割するのを一括でできる。
http://www.vector.co.jp/soft/win95/art/se482746.html