2012年9月26日水曜日

えふすく流 Firefox版・フォントが変わって読みにくくなった「Facebookのフォント」を変更する方法

Firefox版・フォントが変わって読みにくくなった「Facebookのフォント」を変更する方法
http://www.lifehacker.jp/2012/09/120926meiryofirefox.html

という話を聞いて。自分はすべてのサイトでメイリオを使うスタイルシートを使用してるので、応用が利くんじゃないかと思った。

もちろんStylishが前提で

image

これがすべてがメイリオになるスタイルシート。これをFacebook限定にしたいのなら……

image

こうしとけばいいんじゃない?

使ったことないので、ホントにこの範囲で大丈夫かはわかんない(自分で調整してね)けど、この方法ならフォント名がわかる限りいくらでも応用が利くので便利ですよー。

ちなみにえふすくはFacebook使ってませんけどねw

コピペ用ソース

@namespace url(http://www.w3.org/1999/xhtml);

@-moz-document domain("facebook.com") {

*{
font-family:meiryo !important;
}

}

ついでなのでuserstyles.org にも登録。こちらはワンクリックで導入可能


userstyles.org - Facebookだけフォントをメイリオにする
http://userstyles.org/styles/75562/facebook?r=1348667512



2012年9月22日土曜日

Firefox 16 Beta 4が出たので、Windows8上でもう一度Octane Scoreを計測した件

Firefox 16 Beta 4

仮想マシン(VirtualBox)にWindows8RPをインストールして、
例によって面倒なのでキャッシュの削除などは行っていない。

Octane JavaScript Benchmark
http://octane-benchmark.googlecode.com/svn/latest/index.html

Windows8上でもう一度Octane Scoreを計測した件
http://ccf-squarelab.blogspot.jp/2012/09/windows8octane-score.html

  1回目 2回目 3回目 4回目 5回目 平均
Octane Score 5501 5706 5327 5798 5762 5618.8
Richard 8370 8116 8010 7961 8264 8144.2
Deltablue 6050 6539 6089 6797 6579 6410.8
Crypto 13694 12931 13585 13232 13414 13371.2
Raytrace 2905 2829 2866 2957 2835 2878.4
EarleyBoyer 7358 7302 7066 7355 7335 7283.2
Ragexp 1037 1048 1006 1029 1036 1031.2
Splay 8043 6715 5221 6022 6524 6505
NavierStokes 8828 7857 7974 8342 6287 7857.6
pdf.js 4800 4113 3194 4047 4323 4095.4
Mandreel 2722 5303 5338 5442 5528 4866.6
GB Emulator 4322 7108 7059 7087 7276 6570.4
CodeLoad 10092 10026 5867 9292 9706 8996.6
Box2DWeb 7287 6832 7014 7172 7096 7080.2

Firefox 16 Beta 3

  1回目 2回目 3回目 4回目 5回目 平均
Octane Score 5427 5794 5258 5524 5647 5530
Richard 8268 8328 8091 6167 8317 7834.2
Deltablue 6532 6534 6572 6461 5530 6325.8
Crypto 12016 13581 13550 12688 13468 13060.6
Raytrace 2832 2787 2860 2846 2577 2780.4
EarleyBoyer 5961 7114 7089 7141 6526 6766.2
Ragexp 932 1032 995 1007 970 987.2
Splay 6201 6445 3643 6516 6992 5959.4
NavierStokes 7339 7950 4171 6452 8253 6833
pdf.js 3934 4021 5258 3926 3753 4178.4
Mandreel 4136 5556 5354 5344 5479 5173.8
GB Emulator 6772 6957 6667 6857 6902 6831
CodeLoad 9602 10053 10162 10178 10147 10028.4
Box2DWeb 7201 7048 5851 7000 7075 6835

Firefox 16 Beta

  1回目 2回目 3回目 4回目 5回目 平均
Octane Score 5846 5814 5880 5824 5461 5765
Richard 8282 8310 8102 8310 8204 8241.6
Deltablue 6599 6506 6374 5990 6162 6326.2
Crypto 13415 13015 13961 13625 6512 12105.6
Raytrace 2866 2695 2787 2806 2846 2800
EarleyBoyer 7207 7041 7086 7285 7291 7182
Ragexp 1052 1001 1043 1004 1057 1031.4
Splay 6637 6042 6511 6747 6430 6473.4
NavierStokes 7663 8057 8204 8228 8302 8090.8
pdf.js 4136 4278 4335 3893 4014 4131.2
Mandreel 5600 5496 5618 5594 5374 5536.4
GB Emulator 7972 8123 7235 7287 7108 7545
CodeLoad 9341 10508 10601 10466 9401 10063.4
Box2DWeb 6672 6646 6784 6914 6908 6784.8

結論:うーん、キャッシュ力が効いてる可能性大かも

前回よりあからさまに低い数値が主に1回目と3回目に出てる件。
おかげでこれを除けばIron系にも肉薄できそうだけど、実際キャッシュ切ったら全項目減少したのでそれはないか……グラフで見る限りでは成長してる箇所はありそうだ。

image

2012年9月18日火曜日

gImageReader+resseract-ocr-jpnのインストールの仕方

UbuntuでのOCRソフト「gimagereader」の威力を試してみた件
http://ccf-squarelab.blogspot.jp/2012/09/ubuntuocrgimagereader.html

で肝心の「gImageReader+resseract-ocr-jpn」のインストール方法を別のエントリで解説するということで、このエントリを用意した。

方法としてはWindowsでもUbuntuでも「gImageReader」と「resseract-ocr-jpn」のパッケージを見つけてインストールすればよいのだが、日本語を読み取りたい場合はいろいろと設定が必要になる。ただこれもファイル位置やボタンによるもので設定ファイルをテキストエディタで弄るという性質のものではないのでかなり敷居は低いはずだ。

インストールの流れ

image

インストールに関しては順序はほぼ無視できるが、一応resseract-ocr-jpnを先に入れるとgImageReaderをインストールしたときに使用するエンジンとして自動的に設定してくれる(逆でもやってくれるとは思う)ので気分的にラクになる。

それでは各項目について

gImageReader(deb/exe)を取得する 【共通】

Ubuntuの場合、私の手元にあった資料ではapt-getで両方ともインストールできたはずなのだが、現在gImageReaderはできないので直接debパッケージをインストールすることになる。

ダウンロード - gimagereader - SourceForge.JP
http://sourceforge.jp/projects/sfnet_gimagereader/releases/

Ubuntuの人はdeb、Windowsの人はexeをダウンロード。Windowsの場合はgimagereader-win32-support-0.6.zipをダウンロードして展開上書きするのもアリかも。

※Windows版ではこんなのもあるけど……

Index of /~smani/download/gimagereader
http://n.ethz.ch/~smani/download/gimagereader/

Resseract-ocr-setup.exe、jpn.traineddataを取得する 【Windowsのみ】

Windowsの場合はさらに最新のResseract-ocr-jpn.exeをダウンロード

tesseract-ocr
http://code.google.com/p/tesseract-ocr/downloads/list

現在はtesseract-ocr-setup-3.01-1.exeが最新。あと日本語を対応させるための学習ファイルjpn.traineddata.gz もダウンロード。

Resseract-ocr-jpnをインストール 【Ubuntuのみ】

これはソフトウェアセンターで検索すると出るので一発インストール

GimageReader.debをインストール 【Ubuntuのみ】

debファイルなので普通にインストール。これでUbuntu環境でGimageReaderを使えるはず。

Resseract-ocr-setup.exeをインストールする【Windowsのみ】

起動すればそのままインストーラが立ち上がるので従う。インストール場所はえふすくの個人的にDドライブにしてある

jpn.traineddataをセットする 【Windowsのみ】

Windows版のResseract-ocrは日本語の学習ファイルがデフォルトで入っていないので、前の段階でダウンロードした圧縮ファイルを解凍して得たjpn.traineddataをインストール先のTesseract-OCR\tessdataフォルダに入れる。

image

GimageReader.exeをインストール 【Windwosのみ】

これも起動すればそのままインストーラが立ち上がるので従う。同じくインストール場所はDドライブにしてある。

日本語読取用設定を行う 【共通】

この状態で、gImageReaderを起動すると次の画面が出るので日本語を設定する。

image

※赤部分が空白の場合は前述のTesseract-OCR\tessdataフォルダまでのパスを入れる。

imageimage

Preferred laungageを選択できるようになるので「日本語」→「ja_JP」を選択

image

「language」タブでは当然日本語を選択して「Apply」する

image

あとは画像を開くなりスキャナを経由するなりして認識させることができる

ファイルパス、ファイル名に日本語が入っていると読み込めないので注意。
※どちらかというと画像は別にスキャンしておいた方がいいと思う。

Firefox 16 Beta 3が出たので、Windows8上でもう一度Octane Scoreを計測した件

Firefox 16 Beta 3

仮想マシン(VirtualBox)にWindows8RPをインストールして、
例によって面倒なのでキャッシュの削除などは行っていない。

Octane JavaScript Benchmark
http://octane-benchmark.googlecode.com/svn/latest/index.html

Windows8上でもう一度Octane Scoreを計測した件
http://ccf-squarelab.blogspot.jp/2012/09/windows8octane-score.html

  1回目 2回目 3回目 4回目 5回目 平均
Octane Score 5427 5794 5258 5524 5647 5530
Richard 8268 8328 8091 6167 8317 7834.2
Deltablue 6532 6534 6572 6461 5530 6325.8
Crypto 12016 13581 13550 12688 13468 13060.6
Raytrace 2832 2787 2860 2846 2577 2780.4
EarleyBoyer 5961 7114 7089 7141 6526 6766.2
Ragexp 932 1032 995 1007 970 987.2
Splay 6201 6445 3643 6516 6992 5959.4
NavierStokes 7339 7950 4171 6452 8253 6833
pdf.js 3934 4021 5258 3926 3753 4178.4
Mandreel 4136 5556 5354 5344 5479 5173.8
GB Emulator 6772 6957 6667 6857 6902 6831
CodeLoad 9602 10053 10162 10178 10147 10028.4
Box2DWeb 7201 7048 5851 7000 7075 6835

Firefox 16 Beta

  1回目 2回目 3回目 4回目 5回目 平均
Octane Score 5846 5814 5880 5824 5461 5765
Richard 8282 8310 8102 8310 8204 8241.6
Deltablue 6599 6506 6374 5990 6162 6326.2
Crypto 13415 13015 13961 13625 6512 12105.6
Raytrace 2866 2695 2787 2806 2846 2800
EarleyBoyer 7207 7041 7086 7285 7291 7182
Ragexp 1052 1001 1043 1004 1057 1031.4
Splay 6637 6042 6511 6747 6430 6473.4
NavierStokes 7663 8057 8204 8228 8302 8090.8
pdf.js 4136 4278 4335 3893 4014 4131.2
Mandreel 5600 5496 5618 5594 5374 5536.4
GB Emulator 7972 8123 7235 7287 7108 7545
CodeLoad 9341 10508 10601 10466 9401 10063.4
Box2DWeb 6672 6646 6784 6914 6908 6784.8

結論:Firefoxだと振れ幅が激しいベンチですね

……ってBeta1より数値低いぞ。最低値を除けばかなり変わるのかな。
前回の結果を見る限り、ここまでブレるのはFirefox系くらいなものなんだけど……
キャッシュ削除すれば変わるのかなぁ……

2012年9月17日月曜日

UbuntuでのOCRソフト「gimagereader」の威力を試してみた件

実はWindowsでなくても自炊はできる!

条件としてはスキャナにUbuntu(Linux)用ドライバがあるかどうかだけど、一応EPSONはここ

EPSON Download Center
http://download.ebz.epson.net/dsc/search/01/search/?OSC=LX

Canonは正直よくわからない。Linuxで使いたいならえふすくはEPSONをオススメする。

もちろん若干メーカーが認めてるような感じなだけであって動作ができるかどうかの責任は取らない。ただWindowsではできなかったスキャナビボタン(押せば1回分のスキャンが始まる連続スキャンには垂涎の機能)がLinux用では動いたので作業的にはUbuntuでやる方がラクになった(ただし時間はかかる)

問題はOCRだー!

実際「画像が撮れりゃOCRなんぞ要らんだろ」というブコメもいただいたが、あくまで電子書籍を作るのが目的だったし、そのためにどれだけの労力がかかるのか身をもって知ることが大事と考えた。
で、その結果はもう出たので読者のみなさんがマネする必要は一切ない。むしろ無駄だからしなくていいと思うw

で、えふすくにとっての重要な問題点であるのOCRだが、購入した読んdeココのほかにCanonのスキャナについていた読取革命Liteというソフトもある。

とりあえずこの2大ソフトが双璧なわけだが、両方使える以上どっちが使えるのか比較してみようと思った。
そしてUbuntuにもgImageReader+resseract-ocr-jpnという日本語が使えるオープンなOCRソフトがあったのでこれも比較対象に入れてみた。
ただし導入はちょっと面倒だったので、ここでは解説しない(滅殺) 別のエントリで詳細を伝える予定。

【追記】できました

gImageReader+resseract-ocr-jpnのインストールの仕方
http://ccf-squarelab.blogspot.jp/2012/09/gimagereaderresseract-ocr-jpn.html

ではOCR対象を発表しよう!

001

ホンモノの文章(改行は画像に準ずる)

186
尿道に浮いた先走りを吸い立てる、スィーリア。
(う、うぅぅっ……も、もうすぐっ……出る……!)
 腰の芯から脳天にまで、繰り返し繰り返し突き抜ける肉悦楽を与えてくれる彼女の顔は、
きっとまた蕩けきっていて、鼻先を伸ばし貪欲にペニスに食いついているのだろう。想像
するほどに、もっと淫らにしてやりたい──湧いた新たな欲求が、ギリギリのところで射
精の予兆を抑え込んだ。
 ──といっても、射精が間近に迫っていることに変わりはない。ほんのわずか、その時
を先伸ばしにしたに過ぎなかった。
「ぢゅちゅ……っ!」
 ゆえに手早く、がむしゃらに。顔の上に乗る黒いショーツに、伸ばした舌を這わせ、唾
液をベットリまぶし、舐めしゃぶる。
「んぷぁ……!? ぁんっ、た、貴弘っ。今日は私が奉仕をするとッ、やっ、あ、あぁ、っ
く、あぁ……ん-っ!」
(甘くって……ネバネバで、ぅあ、あぁっ、意識が飛んじゃいそぉっ……)
 鼻から息を吸えば、スカート内に充満した恋人の香りばかりが肺の中へ流入した。小さ
く薄い、汁濡れの股布を脇に押しのけ直接割れ目をねぶり始めた舌先は、吸いつく間もな
く止め処ない蜜で浸され、飲んでも飲んでもあふれてくる甘酸っぱい味わいに、今にも溺

二次元ゲーム文庫11 ワルキューレ ロマンツェ[スィーリアの恋物語] の186ページ。
メイドコスになったスィーリアがおっぱい丸出しで貴弘と69するシーン。

以前もこんな感じのシーンを使いましたが、もともと私の自炊はエロラノベの電子化が目的なのと、こういう「……」みたいな記号や「んーっ!」みたいな誤変換の多そうな文章ってこういう小説の方が当然見つけやすいわけで。と言い訳します。

画像はここに上がったものをそのまま使って各ソフトに入力(全部画像からの入力が可能というのはスキャナを問わないという意味では便利)して、OCRした結果をそのままコピペ(改行コードについてはWindwosに合わせて置換)で結果報告。

読んdeココ Ver.13

認識結果

186
尿道に浮いた先走りを吸い立てる、スィーリア。
(う、うぅぅ……も、もうすぐ……出る……
 腰の芯から脳天にまで、繰り返し繰り返し突き抜ける肉悦楽を与えてくれる彼女の顔は、
きっとまた蕩けきっていて、鼻先を伸ばし貪欲にペニスに食いついているのだろう。想像
するほどに、もっと淫らにしてやりたい1-いた新たな欲求が、ギリギリのところで射
精の予兆を抑え込んだ。
 - といっても、射精が間近に迫っていることに変わりはない。ほんのわずか、その時
を先伸ばしにしたに過ぎなかった。
「ぢゅちゅ……!」
 ゆえに手早く、がむしゃらに。顔の上に乗る黒いショーツに、伸ばした舌を這わせ、唾
液をベットリまぶし、舐めしゃぶる。
「んぷぁ……け‥ぁんっ、た、貴弘っ。今日は私が奉仕をするとッ、やっ、あ、あぁ、
く、あぁ……ん-つー
(甘くって……ネバネバで、あ、あぁっ、意識が飛んじゃいそぉっ……)
 鼻から息を吸えば、スカート内に充満した恋人の香りばかりが肺の中へ流入した。小さ
く薄い、汁濡れの股布を脇に押しのけ直接割れ目をねぶり始めた舌先は、吸いつく間もな
く止め処ない蜜で浸され、飲んでも飲んでもあふれてくる甘酸っぱい味わいに、今にも溺

【感想】さすがの検出率である。大文字・小文字の区別はさすがに手作業が必要だが、縦書き特有の「!?」→「け‥」、「!)」→「⊥」あたりは1000ページ近くもやってるともうクセとしてマクロに登録して処理がしてる程度だ。

読取革命Lite 1.2.00

認識結果

186
尿道に浮いた先走りを吸い立てる、スィーリア。
 (う、うううっ……も、もうすぐっ……出る……!・
 腰の芯から脳天にまで、繰り返し繰り返し突き抜ける肉悦楽を与えてくれる彼女の顔は、
きっとまた蕩けきっていて、鼻先を伸ばし貪欲にペニスに食いついているのだろう。想像
するほどに、もっと淫らにしてやりたい湧いた新たな欲求が、ギリギリのところで射
精の予兆を抑え込んだ。
 といっても、射精が間近に迫っていることに変わりはない。ほんのわずか、その時
を先伸ばしにしたに過ぎなかった。
 「ぢゅちゅ……!」
 ゆえに手早く、がむしらに。顔の上に乗る黒いショーツに、伸ばした舌を這わせ、唾
液をベットリまぶし、翫めしゃぶる。
 「んぷ……り‥ 、た、貴弘っ。今日は私が奉仕をすると、やっ、あ、あ
く、あ……ん1つ!」
 (甘くって……ネバネバで、あ、あっ、意識が飛んじやいそおっ……)
 鼻から息を吸えば、スカート内に充満した恋人の香りばかりが肺の中へ流入した。小さ
く薄い、汁濡れの股布を脇に押しのけ直接割れ目をねぶり始めた舌先は、吸いつく間もな
く止め処ない蜜で浸され、飲んでも飲んでもあふれてくる甘酸っぱい味わいに、今にも溺

【感想】廉価版とはいえ読んdeココ並みの精度を持っているお買い得ソフトかもしれない。他の機能が読んdeココ並みに使えるならばCanonユーザーはこっちをアップグレードした方が安上がりかも。
ただこちらは漢字の誤認がほとんどなく、記号や大文字・小文字ミスがほとんどなので、目立つ部分をマクロで処理、というわけにはいかなさそうなのが残念だ。

gImageReader+resseract-ocr-jpn(Ubuntu)

認識結果

尿道に浮ぃた先走りを吸い立てる、 スーリァ。

()っ、 }つ)っ、っ っ ・・・・ '.も、 も'っすぐっ ・・・・ 〟.出る ' ' ' . ・ - ー')

腰の縄心から脳天にまで、 繰り返し繰り返し突き抜ける肉悦楽を与)ぇてくれる彼女の顔は
きっとまた蕩けきっていて、 鼻先を伸ばし貪欲に。ヘ 一{スに食いついてぃるのだろ}っ。 想像
するほどに、 もっと淫らにしてやりたぃー湧ぃた新たな欲求が、 ギリギリのと,」ろで射
精の予兆を抑)ぇ込んだ。

といっても、 射精が間近に迫っている,」とに変ゎりはない。 ほんのずか、 その時
を先伸ばしにしたに過ぎなかった。

「ぢゅちゅ .... ・-っ"

ゅ,ぇに手早く、 がむしゃらに。 顔の上に乗る黒い`ンョーツに、 伸ぱした舌を濃縄ゎせ、 唾
液をベ ットリまぶし、 舐めしゃぷる。

「んぷぁ .... ・-m〝 ぁん っ、 た、 貴弘っ。 ムゥ日は私が奉仕をするとッ、 ゃつ、 ぁ、 ぁぁ、 っ
く、 ぁぁ ・・・・ ,ーんーつ ー・

(甘くって ---- ・.ネ〟ハネ〟ハで、 )っぁ、 ぁぁっ丶 意識が飛んじゃいそぉっ .... ・.)

鼻から息を吸.乙ート内に充満した恋人の香りぱかりが肺の中ヘ流入した。 小さ
く薄、 汁濡れの股布を脇に押しのけ直接割れ目をねぶり始めた舌先は、 吸いつく間もな
く止め処ない蜜で浸され、 飲んでも飲んでもぁふれてくる甘酸っぱい味ゎぃに、 ムゥにも溺

【感想】さて、いよいよオープンソフトの出番なのだがかなり残念な結果になってしまった。特に記号や喘ぎあたりの認識が完全に狂っている。漢字の認識にも問題が残っているようだがこれは市販品を考えるとまだまだ向上の余地はありそうだ。「こ」→「.」」「今」→「ムゥ」あたりのパターンも目立つ

gImageReader+resseract-ocr-jpn(Windows)

認識結果

尿に浮いた先走りを吸い立てる、スイ1リァ°
っつ、 、つううつ ・・・・ ・・も、 も_つすぐつ ____  I I I I ` _
l憂v
腰の芯から脳天にまで、繰り返し繰り返し突き抜ける肉悦楽を与てくれる彼女の顔は
とまた蕩けきっていて 鼻先を伸ばし貪欲にペ ニスに食いつぃているのだろうo 想像
するほどに、 もっと淫らにしてりたぃl湧いた新たな欲求が ギリギリのところで射
の予兆を抑え込んだo
|lぃつても、射糟が間近に迫ていることに変ゎりはなぃ°ほんのゎずか、その時
を先伸ばしにしたに過ぎなかつたo
芍ぢゆちゆ ____ :っ'屮 ー
ゆえに手早<、がむしらにo顔の上に乗る黒いシヨ竇ッに、伸ぱした舌を這ゎせ、睡
液をべットリまぶし、舐めしゃぷるo
門んぷぁ ____ :瞬 あんっ、 た、 貴弘つ。 今曰は私が奉仕をするとッ、 や、 あ、 あぁ、
ノ\ ああ ____ :んlつ`こ
ハ甘<つて ____ =ネバネバで、あ、ぁあつ、意識が飛んじゃいそぉつ ____ 上
鼻から息を吸ぇば丶スヵ1ト内に充満した恋人の香りぱかりが肺の中へ流入した°小さ
<簿い、汁濡れの股布を脇に押しのけ直接割れ目をねぷり姶めた舌先は<間もな
<止め処ない蜜で浸され、飲んでも飲んでもあふれて<る甘酸っぱい昧ゎぃに、今にも溺

【感想】実はgImageReader+resseract-ocr-jpnにはWindows版がありUbuntu版に比べるとresseract-ocr-jpnのバージョンが若干高い。そのせいなのか認識率は向上しているがやはり「く」→「<」や句読点の誤変換など修正が面倒なモノが多く実用的とは言い難い。
ただ、ここまで向上が可能ならば今後のバージョンアップも期待していいのかもしれない。
 ※オレンジ部はなんなのだろうか

まとめ

  1. 市販品では差がないから、買った方についてたものをアップグレードがいいと思う。
  2. でも手作業での校正をラクにしたかったらクセの読める読んdeココかな。
  3. gImageReader+resseract-ocr-jpnは向上の余地もあるし、思ったより漢字の精度は高い。Windowsでも使えるのは朗報なので安物が駆逐できるくらいはレベルアップしてほしい。

2012年9月13日木曜日

TwitterのRT/Fav相手をほぼ網羅する方法

image

私はTweetDeck使いだが、最近RTやFavの人数だけになってしまい、誰がRT/Favしているのかわからなくなった。


 

ということでTwitterから見ることになるのだが、こちらも9人が限度で、しかもRTとFavの区別がつかない。

image

いったいどうすればいいんだ。と思ったのだが、数字があるということはその先にその内容があるのではないか、と気が付いた。

つまりここである。

image

するとRTしてくれたメンバーの一覧が表示される

image

フォローボタン等があるのでそのままフォローするもよし、名前部分のリンクをホイールクリックすればこの画面のまま別のタグにそのメンバーのページを覗けたりするので取捨選択にとても役立つ。ただ人数が多いと全員とはいかないようだ。

image

もちろんお気に入りの数字をクリックすれば、RTと同様にお気に入りにしてくれた人の一覧を表示することもできる。

きっとみんな気づいていることだが、自分はこれのためにFavStarに29ドル払ってしまった阿呆なので、こうでもしないと溜飲が下がらないのだ(滅殺)

エロラノベの自炊をしてみた記録 その3【完結編?】

エロラノベの自炊をしてみた記録 その2
http://ccf-squarelab.blogspot.jp/2012/09/blog-post_11.html
の続きです

今度こそ作成したHTMLからEPUBやその他の電子書籍用フォーマットを生成する段階。
ツールは電子書籍の生成と管理を行える

calibre - E-book management
http://calibre-ebook.com/

を採用。えふすくはPortable版を使ってPortableAppsのランチャー経由で使えるようにしている。

① まず、問題のHTMLをドラッグ&ドロップでcalibreに登録する

0000

送るのはHTMLファイルだけでいい。

0001

登録が完了すると、これはHTMLファイルと画像ファイルをまとめてZIPに圧縮したものとして保管される。

② 書籍情報を編集する

編集したい書籍を右クリック、[書誌を編集]→[書誌情報を個別に編集]を選択すると書誌編集画面が現れる。

image

image

ここで必要な情報を入力する。必要なものは

  • タイトルとタイトルソート
  • 著者と著者ソート

この2つを入力した後、[書誌情報をダウンロード]するとAmazon.co.jpからこれらをキーにした書影や書籍情報が自動入力される。ソートキーが合わないと出ないので、Amazonでの表記に気を付けて入力すること。

image

image

image

③ 好きな電子書籍フォーマット(ここではEPUB)に変換する

書誌情報が揃ったらいよいよ変換。右クリックで[本を変換]→[個別に変換]を選択。

imageまずは右上の[出力フォーマット]で[EPUB]を選択する

image

あとは[EPUB出力]タブにした後[OK]でEPUBへの変換がすぐに完了する。

image

EPUBフォーマットに書籍ができていることがわかる。

image

④ 完成したEPUBを読むには……

calibreにはEPUBリーダーが内蔵されているので、そのままダブルクリックでもいいのだが、逆にエクスプローラへのドラッグ&ドロップで任意の位置に出力することができる。

image

出力したEPUBファイルはローマ字になっているので、日本語に直してから(直さなくていいけど)好きなデバイスに移して好きなEPUBリーダーで読むことができる。

個人的なお勧めはAndroidタブレットに移してCopperReaderというEPUBリーダーを使うこと。これは縦読みが可能なうえに段組みができるので文庫だったはずのエロラノベをノベルズのように読むことができたりしてなかなか新鮮な体験ができる。

image

以上が私の長いエロラノベ自炊の記録である。正直フラットヘッドでは辛いものがあるが、前述の通り挿絵のないエロ小説などは非破壊でスキャンができる可能性が高まる。
私も次回からはADFの用意されたスキャナを購入してから臨みたいのだが、やはり予算と校正(画像だけなら不要なんだが……)の問題が……

私だけのケースであり、実はいろんなところで設定に微調整を加えているはずなのだが、執筆に当たってはすっかり忘れてしまった。もしかするとこの手順のままでは詰まるかもしれない(滅殺) よっぽど致命的ならFAQ追記も考えるので質問等も受け付けたい。

2012年9月12日水曜日

なんか嫌いなサイトを地獄に送るアドオンが流行っているらしいけど……

アドオンよりは……
@namespace url(http://www.w3.org/1999/xhtml);
@-moz-document domain("えふすく.com")  {
body *{display:none}

}
ってStylishで作っちゃったほうがよくない?

@namespace url(http://www.w3.org/1999/xhtml);
/*ドメイン1つ目*/
@-moz-document domain("えふすく.com")  {
body *{display:none !important}

}
/*ドメイン2つ目*/
@-moz-document domain("えふすく2.com")  {
body *{display:none !important}

}
/*twitterの場合*/
@-moz-document url-prefix(https://twitter.com/FSQUARE){ 
body *{display:none !important}
}

こんなふうに2つ以上のサイトやTwitterにも対応できるよ。
短縮でも開いた先がこれなら発動するはず。

そしてこれは見た目真っ白だから、むしろ天国送りだねw

【追記】body *{display:none !important} がベストかな?

【追記】Chromeにもスタイルシート上書き拡張あったと思うけど全体に効くかなぁ?

Amazonマケプレの出荷通知の入力が楽になった件

今までは発送会社に発送サービス、そしてトラッキング(伝票)ナンバーを入力しなければならなかったんだけど、今日の出荷を入力しようとしたら……

image

デフォルト設定で2回目以降はトラッキングナンバーだけの入力で済むようになりました。
たまに荷物の大きさ的に別のサービスを使うときは、右上の「出荷情報の編集」で再入力が可能になる模様。これは次回の発注を受けた時に試してみようと思う。

2012年9月11日火曜日

エロラノベの自炊をしてみた記録 その2

エロラノベの自炊をしてみた記録 その1
http://ccf-squarelab.blogspot.jp/2012/09/blog-post.html
の続きです

いよいよEPUB作り……の前に原料であるHTMLを作る

前回の作業で、エロラノベ1冊を文章部分と画像部分に分類したわけだが、当然のことながら電子書籍ではこれらを1つに統合しなくてはならない。
文章と画像を同時に扱えて、エディタで組めるソース的なものと言えば……HTMLということで、今回はHTMLを採用してみることにした。

エディタはMeryプラグイン:テンプレートを使用している。

① まずはHTMLの基礎を作る

Meryの[ツール]→[プラグイン]→[テンプレート]を選択した後、[HTML]→[基本ページ]を選択することで以下のHTMLひな形が完成する。

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>お嬢様がお買い上げ 振り袖彼女はご主人様で恋のドレイ</title>
</head>

<body>
</body>
</html>

titleタグ内はこれから作成する電子書籍のタイトルでも入れておく。あと文字コードはUTF-8が望ましい。ここで変更するより、テンプレートの方で修正しておきたい。
実際のソースはbodyタグ内に書くことになる。


② 目次を作る


OCR作業で最初のページを作った際、目次をテキスト化したものを作ったはずなので、ここをリスト化して各章を本文のそれぞれの位置に内部リンクさせておく。
リンク先についてはこの後の本文の追加の時に記述する。


目次の例



プロローグ 幼なじみと再会? ……7
第一章 1億円でヤクサお嬢様に買われて ……14
第二章 お嬢様をイカせるのが執事の仕事 ……63
第三章 いっときの逆転、ふたりの関係 ……100
第四章 彼女は主人、彼女はドレイ…… ……152
第五章 対等な恋人として、お尻H(はーと) ……201
エンディング 手と手をつないで ……253


<ul>
<li><a href="#0000">プロローグ 幼なじみと再会?</a> ……7
<li><a href="#0001">第一章 1億円でヤクサお嬢様に買われて</a> ……14
<li><a href="#0002">第二章 お嬢様をイカせるのが執事の仕事</a> ……63
<li><a href="#0003">第三章 いっときの逆転、ふたりの関係</a> ……100
<li><a href="#0004">第四章 彼女は主人、彼女はドレイ……</a> ……152
<li><a href="#0005">第五章 対等な恋人として、お尻H(はーと)</a> ……201
<li><a href="#0006">エンディング 手と手をつないで</a> ……253
</ul>

これをさっきのHTMLのbodyタグ内の最初の項目として挿入する。


③ 画像・文章を挿入する


画像を挿入する場合、前後には文章があるはずなのでそれらは別にdivまたはpで括っておく。例えば画像0020.jpgを挿入する場合、前後には0010.txtと0020.txtを用意したので



<p>(0010.txt全文)</p>
<img src="0020.jpg">
<p>(0020.txt全文)</p>


という形になる。テキストファイルをHTML文書にそのままコピペすると改行がなくなるが、これは後で処理するのでここではこれを繰り返して全文をまとめたHTML作りを優先する。


④ 各章のリンク先を設定する


①で作った目次のリンクで各章に本当に飛べるようにマーカーを設定する。
第1章の場合、文章中の章題部分を見つけて、<a name="0001">を設定すればよい。
見栄え上、章題は<h1>か<h2>を使って③の画像のようにすべきだと思う。



(略) 川本光一が尾崎紫苑と個人的な話ができたのは、それから二ケ月近くあとの七月のはじめ。梅雨がようやくあがった頃、紫苑邸でのことだった。</p>
<h1><a name=”0001”></a>第一章 1億円でヤクサお嬢様に買われて</h1>
<p> 
その男が訪ねてきたとき、川本光一は、リビングのテレビに向かってゲームをプレイしていた。(略)


⑤ 結合が終わったら順番が正しいかどうかチェック


こういうときにも校正の漏れがわかるので適宜修正する。
章リンクもチェックチェック。


⑥ 改行を一括置換する


私がMeryで使っているのは、



 1回目 \n(改行コード) → <br>\n
 2回目 ><br> → >


2回目はすでにタグのある行に対して改行を行わないためである。


⑦ HTML完成チェック


やはりきちんとできているかチェックする。小説であればあまりないのだが、新書だと太字や斜体、文字色などの指定もあると思うのでその辺はここで指定する。


以上で文章と画像を結合したHTML文書が完成。
次はツール(calibre-portable)を使った、電子書籍方式への変換を行う。


imageここまでできたの図


エロラノベの自炊をしてみた記録 その3【完結編?】
http://ccf-squarelab.blogspot.jp/2012/09/blog-post_13.html
に続く