Archive for 06-2012

ソニーReaderのEPUB3は本物?

 こ、これは…

 恥ずかしながら先日アップした「鏡花短編選 深山編」のEPUBに、大きな問題があることに今頃になって気づいて、ファイルを引っ込めました。「銀短册」という長めの短編というか短めの中編の、20章のうち19章辺りで、プツリと表示がとぎれてしまっているのです。ソニーReaderの方の現象で、iOSのKinoppyでは問題なく最後まで表示されています。

 テキストや指定に何か問題があるのだろうと思ったのですが、仔細に見ても問題らしき点は見つかりません。となると、ソニーReaderの問題ということになるのでしょうか。確かに「銀短册」は3つの短編集中、一番長い作品で、なおかつ総ルビのルビタグだらけのファイルですから、その負担にReaderが音を上げたとも考えられますが、それにしてもこの程度で…。

 そういえば「世話編」の「假宅話」でも、途中の特別に長い段落のせいか、ページ送りが極端に遅延するという現象が見られました。バグと覚しい動作も見られますし、ソニーReaderのEPUB3対応には何かと問題があるようです。どうしたことでしょう。

 にわかにReaderの能力への疑惑が生じて色々ググってみると、何とこんなブログに出くわしました。個人の方のブログですが、3月末のReaderのアップデート直後にソニーに確認して「コミックなど固定レイアウト型の EPUB3について動作確認しているが、縦書きの本などに対しては保証できない」というコメントを得たというのです。

 そんなあ~、という感じです。そういえばアップデートの際のソニーのアナウンスは「EPUB3固定レイアウトへ対応」でした。けれど、試してみて文章物もちゃんと縦書き・ルビ打ち表示をしたので、ついに待っていたEPUB3環境が手に入ったのだと興奮したのですが、ソニーはもともとリフローには腰が引けていたようです。不自由な既存のフォーマットに代わって、誰でも自由に利用できるオープンなフォーマットをしっかりサポートして、新しい電書ムーブメントを主導していこう、なんて気はちっともなかったのです。

 だから、Readerは少し重いデータにはすぐに音を上げてしまう。いやはや、弱りました。「今最も実用的と思われる二つのEPUB3読書システム」の一方の実用性に疑問符がついてしまいました。もう一方のKinoppyも最近よく落ちますしね。これから江戸物のテキストなどもEPUBに放り込んでしまおうと意気込んでいるのに、作ってもそれが読書端末でちゃんと表示できるかどうか保証がないというのは、著しくモチベーションを損ねる状況です。

 こうなればソニーさんがリフローEPUB3に本腰を入れてくれるのを待つのみ? しかし時代は動いています。もうすぐ楽天kobo発売。koboは必ずEPUB3を積んできますから、頼りないReaderに代わって確かな受け皿になってくれるかもしれません。koboに刺激されてソニーのEPUB3対応が進む可能性も。Kindleの動きもここにきて急加速し、この夏はようやく熱くなってきた専用端末のニュースを注視しながら、EPUB遊びを続けていくことになりそうです。

追記)ソニーReaderのマイナーアップデートが7月3日にあって、ファームウェアのバージョンが2.0.02.06220になりました。で、これを当てると、上記「銀短册」のしり切れとんぼ現象は解消しましたが、今度は20章の最後の方で、なぜか段落間に数行の空きが出現するという現象が私のPRS-T1では見られています。また、「世話編」の「假宅話」でページ送りが極端に遅延するという現象もそのままです。まあ、しり切れとんぼという最悪の状態は脱しましたので、「深山編」のEPUBファイルは再アップしましたが、なんだかなあという感じです。ソニーさんはハリポタの電子化権を手に入れて、8月には出すそうですが、フォーマットは何で出すんですかね。EPUB3なら端末がこのままで大丈夫?

Comments (4)

鏡花 vs EPUB3 感想

 ソニーReaderのEPUB3対応が発表された3月末から約3カ月、鏡花作品のEPUB化という目標を個人的に設定して、試行錯誤を楽しんできました。そして数回にわたってその報告をしてきたわけですが、ここではその要点をまとめておきます。旧字旧かな総ルビの鏡花本を試金石にした、EPUB3とその読書システム(具体的にはソニーReaderとiOS版Kinoppy)の評価、といえば大層ですが、まあ感想を書き連ねてみます。

●旧字
 電子本でも作者が好んだ文字の姿そのままで鏡花を読みたい、という私のような偏狭な読者兼入力者にとって、EPUB が鏡花本の膨大な旧字にどこまで対応できるかは最大の関心事であり不安点だったわけですが、残念ながらというか、事前に予想できた通りというか、その願いは十分には適えられませんでした。

 EPUB は文字コードとしてユニコードを採用していますが、ユニコードに収録された文字がどこまで使えるかは、結局、読書システムが拠っているフォント次第ということになります。また、漢字には同じ働きをする漢字でも形が異なる異体字というものが数多く存在しますが、それを区別して独自に番号を振るということは、ユニコードでは行なわないことになっているようです。特に後者の異体字は鏡花本に頻出しますから、鏡花が使った異体字のEPUBでの完全な再現はあきらめなければなりませんでした。その場合は、新字や略字などの基本の字に置き換えて表示するしかありません。文字画像で表示するという方法ももちろんあり得ますが、鏡花の場合、その膨大さを考えるととても実用的とは言えません。文字画像を使用するのは、異体字どころか基本字も存在しない外字のみということに留めるのが、現実的な対応だと思います。

 ただし、どういうわけか異体字でも独自のユニコード番号を振られたものがあり、それは使うことができます。たとえば、拔・樣・顏などのような、かなりの異体字を生かすことができます。つまり、3つの鏡花本は異体字のままのものと異体字をあきらめて基本字にしたものとのチャンポンになっているわけで、漢字の扱いとしては統一した基準を持たない場当たり的な状態と言わなければならないでしょうね。まあこれは、偏狭な愛好者が個人的な嗜好を優先して作った電子本ということでお許し頂きたいと思うのですが、もし世に知られた出版社がEPUB本として鏡花を扱う場合は、岩波の「新編泉鏡花集」のように総ルビ・旧かなでありながら漢字は新字を使うという、これまた不思議な姿で出す他ないのが現状ではないかと思います。EPUB には鏡花はまだ荷が重いようです。

 けど、先に希望がないわけではありません。DTPの世界にはAdobe社が作ったAdobe-Japan1という、異体字の字形それぞれに番号を割り当てた文字コレクションがあり、それを含んだフォントもあって、DTPではこれらを使うことで鏡花の異体字もほとんどが再現できます。EPUBと一緒にアップしているPDF版はこのAdobe-Japan1を利用したもので、表示できなかった異体字はわずかしかありませんでした。もし将来、このAdobe-Japan1のコレクションをEPUBで利用できるようになれば、その時初めて、鏡花本の豊麗な紙面をEPUBにそっくり移植できるということなるのではないかと思います。

 ところで、初めに「ユニコードに収録された文字がどこまで使えるかは、結局、読書システムが拠っているフォント次第」と書きましたが、その点では、今最も実用的と思われる二つのEPUB3読書システム、ソニーReaderと iOS版Kinoppy には十分に強力なフォントが積まれているようです。たとえば、iOSにはKinoppyの他にもbREADERというEPUB3に対応した読書アプリがあって、これで見ると鏡花EPUBはけっこう文字化けを起こします。積んでいるフォントの収容文字数の違いでしょう。もしbREADERを読書環境の基準と考えた場合は、鏡花EPUBの文字はさらに制約を受けることになってしまいます。

 だから、本来、全EPUBリーダーのフォント環境は同一レベルであることが望ましいのですが、そうなっていないのが現状のようです。またソニーReaderと Kinoppy にしても、片方で表示できても片方はだめという字がわずかながらありました。たとえば、u2f8b2の成の異体字。この字は独自のユニコード番号をもち、EPUB でも表示できるはずです。ところが、Reader内蔵の筑紫明朝では表示できるのに、Kinoppy の各フォントでは文字化けします。どうしてなのか、その辺の仕組みは私には分りませんが、鏡花EPUBは異体字を一つ損しました。

 EPUB の旧字対応に関する感想はこんなところですが、ここまで旧字にこだわる必要があるのはごく特殊なケースで、多くの場合、ユニコードが使えるEPUB の文字環境は必要十分だという一般的な評価も、また事実だと思います。たとえば明治・大正の文学でも積極的に新字に書き替え、場合によっては仮名遣いも直した方が、現代の読者には読みやすいだけでなく、理解も深まるという場合も多いのです。御大漱石の小説にしたって、新字新仮名で読んでその面白さに何の不足も生じないし、その本質的な意義も十全に伝わるのではないでしょうか。ただし、鏡花の小説やたとえば日夏耿之介の随筆や近代の詩歌の全部については、それをしたら失うものが少なくありません。考えてみると、それを平気でやってきたのが戦後の出版だったわけですが、電子書籍にはその轍を踏んでほしくありません。EPUB出版の自由さが原典の再生と尊重につながり、EPUB読書の自由さが忘れられかけている文学の再発見と日本文の再生につながればと思います。

●ルビ
 総ルビの文章をEPUB化するなど、考えたらぞっとする作業ですが、それをやってしまうのが愛好者というものです。いえ、私のことではなく、[鏡の花]というサイトがあって、春陽堂版全集を底本に精力的に総ルビ・旧字の鏡花をPDFでアップしていっておられます。これに比べたら短編選3編の総ルビなど大したことはありませんが、それでも入力には素の文章のまあ1.5倍の手間はかかりました。ただ、今回は入力にinDesignを使いましたので、テキストにルビタグを書き込むよりは少し省力化できたかもしれません。

 もっとも、EPUBでのルビタグの振る舞いを事前に調べておかなかったせいで、後でグループルビをモノルビに全面変更するという二度手間に陥ったしまったのは、inDesignに頼りすぎてしまったせいかもしれません。inDesignからのEPUB書き出しは、確かに便利な部分もありますが、その後の手修正の手間も少なからず発生します。inDesignは気づかないような小さな指定のブレも、律義に拾ってEPUBに書き込んでしまいますので、それを取り除くのがちょっと面倒だったりします。たとえば、本文やルビのフォント指定が一部別のものになっていたりすると、それだけでHTMLとCSSに立派なクラス指定が出現したりします。また、inDesignはルビタグに未対応ブラウザのための rpタグを入れてしまいます。 ルビ対応が義務化されたEPUB3ではこれは不要で、ただでさえルビタグのせいで肥大化しているHTMLには負担ですので、これも全部除去しなければなりませんでした。ルビが少ないテキストの場合は、TEXTファイルを直接Sigilに読み込んだ方が手間がかからないかもしれません。

 で、EPUBでのルビタグの振る舞いですが、複数の漢字に一度にルビを振るグループルビを使うと、そのルビの途中での改行はできなくなります。そのため熟語がそっくり次行に送られてしまって、行末が揃わなくなります。これを避けるには、グループルビを使わず漢字一字ごとにルビを振るモノルビに変えるしかなかったという次第です。また、inDesignでスペース区切りのモノルビを熟語に当てている場合も、EPUBではグループルビになり、しかもスペースがルビに残ってしまいますので、これもモノルビにせっせと変更しました。モノルビのみの指定は手間が多く、またタグが増えてHTMLが膨らんでしまいます。今後は、ネット上で言われているように、グループルビと同様にまとめて指定できて、しかも途中改行を許す「熟語ルビ」のEPUBへの追加を待ちたいところです。

 次に読書システム側でのルビへの対応について。最初、ルビが指定通りに振られて表示された時は感激したものですが、じっくり見ていくと気になる点も見えてきます。まず、ソニーReaderのルビは中付きで、1文字に3字以上のルビだと、親文字の前後の字間を広げる設定になっているようです。このため総ルビの場合、字間の広がった個所が頻繁に出てきて、文字の連なりが少しぎくしゃくした印象になります。一方、Kinoppyのルビは肩付きで、Readerのように字間を広げる処理はまったくせず、そのまま下へルビを垂らして、他の文字にかかるままになっています。極端な場合は右のようなことになります。Readerの方がルビの扱いとしては丁寧なのでしょうが、字間を広げるのと、他の文字にルビをかける「文字かけ」処理を併用して、できるだけ字送りを維持してもらえたらと思います。そもそも、読書システムによってルビ処理がマチマチなのが気になります。上に触れた文字環境の不統一といい、読書システム間の処理の統一が望まれます。

●旧かな
 かな文字については何の文句もありませんが、繰り返し記号のくの字点もかなに入れるなら、両読書システムで改行での泣き別れが発生するのが困りものです。禁則処理に含まれていないのでしょうか。「white-space: nowrap;」で改行禁止にしてみると、Kinoppyでは効果がありましたが、Readerでは効かないようです。また、句読点の禁則違反も両方でまま見られます。この辺りは今後のチューニングに期待するしかありません。

●体裁・レイアウト
 EPUBのレイアウト能力については、総扉などは画像貼り込みですし、中面も単純なことしかやっていないので、突っ込んだ評価はできません。これまでの投稿で苦労した点として報告したのは、扉ページの縦1行のタイトルを左右中央に配置する方法がなく、横組みにして中央で一字づつ改行という奇策を使ったというのと、突き出しインデントになった引用文で、ソニーReaderの半角起し括弧を処理するのに困り、これも白文字を使うという禁手を使ったこと。これらはEPUB規格の今後の拡張とリーダーの改訂を待つしかなさそうです。今回は使わなかったけれど、今後お世話になるかもしれないレイアウト機能としては、ページ内への写真や挿絵の配置、注、段組などがあげられますが、EPUB雑誌などもっと複雑なレイアウト物をめざすのでなければ、基礎的なレベルのCSSで何とかやっていけるのではないかと考えています。

 読書システムの側のレイアウト機能として気になったのは、マージンへの対応が両機で違っていたこと。ソニーReaderはCSSでのページの余白指定に反応しますが、Kinoppyは独自の余白を保持したままです。そしてReaderの方も、マージンをゼロにしても周囲にわずかに余白が残ります。実は総扉の画像を絶ち切りのように画面一杯に表示したかったのですが、これはあきらめました。

Comments (2)

ソニーReaderの行頭半角括弧に泣く

  三つめの鏡花短編選、「深山編」をアップしましたが、今回もEPUB版で難題が一つ。最後の「雪靈續記」の唄の引用部分。底本では「雪やこんこ、霰やこんこ。」の唄の2行などが、全体を大きく下げた上で、先頭の鍵括弧だけ1字上げて、というか2行目の頭を1字下げて、雪と霰の並びを揃えています。まあ普通こう組むでしょうね。下は iOSのKinoppyの表示で、2行目の頭を1角下げることで底本通りに揃えることができます。けど問題はソニーReader。

 ソニーReaderのepub3は以前に触れたように、起こし鍵括弧が半角に固定されています。そのため2行目を1角下げると1行目より半角多く下がることになってしまうのです。こんな具合。

 かといって、Readerに合わせて下げを半角にすると、今度はKinoppyで揃いません。このままで仕方がないかとも思いましたが、あまり体裁がよくないので一応色々試してみます。例によって泥縄式に検索でそれらしいタグを見つけて片っ端から試します。pre、tt、monospace、white-space…、いづれも効果なく、ソニーReaderの半角鍵括弧は動きそうにありません。Readerで揃ったらKinoppyでズレ、Kinoppyで揃ったらという具合。お手上げであきらめかけた時、起死回生のアイデアが閃きました。

 2行目の頭にも鍵括弧をつけてしまうのです。そうすれば、それが半角であろうが全角であろうが、字は揃います。そして2行目の鍵括弧を見えなくしてしまえばいいのです。CSSで鍵括弧の色を白にするとうまく消えました。バックに色を敷けるビュワーではばれてしまうトリックですが、白バックのみのReaderとKinoppyには有効です。ただし、テキストデータとしてはこの鍵括弧は確かに存在し、しかもあってはならないものですから、これはあくまで、特定のリーディングシステムでの視覚的表象のみに特化した制作事例で、EPUBをインターネットに流通する書籍データの一つとして考えた場合は、明らかに禁じ手ということになるのではないかと思います。タイトルページの擬似中央縦書きといい、こんなことばかりやっていますが、EPUBでの見場と実データとのバランスはよく考えるべき問題だと感じます。

 それにしても、ソニーReaderの起こし鍵括弧の半角固定はやはり少々迷惑ですね。もちろん、組版の方針として行頭括弧の天付きはあり得ますが、先行のドットブックやXMDFは全角で行っているようですし、印刷本でも最近は改行行頭は全角が主流で、半角はあっても非改行の行頭のみというのが多いように思います。特に、会話文が独立した段落になることの多い小説では、鍵括弧に続く文字が、地の文の改行冒頭と揃った方が自然に感じられ、その点でもReaderの改行行頭半角鍵括弧固定は無理があると思います。

 さて、こんなことで一喜一憂しながら好きな作品のEPUB化を楽しんでいる次第ですが、鏡花短編選のシリーズはこれで打ち止めで、後は親サイトの書庫に長く置いている古典テキストや、でき得れば返り点などを使った漢詩文のEPUB化にも手をつけてみたいと考えています。また翻刻ものだけでなく、オリジナルな作物もいずれ出してみたいという下心も抱いています。

Comments (2)

EPUB3で外字画像を使う

 「世話編」に続いて「鏡花短編選 北国編」の EPUB3版をアップしました。今回は「世話編」のレイアウトがほとんど流用でき、作業は格段にスムーズに進みました。ただし、唯一の難題になったのが外字。[火+發][氵+散][辟+鳥]の3字が、リーディングシステムのフォントに含まれず、異字に置き換えることもできない、正真正銘の外字として立ちふさがりました。幸い花園明朝というユニコード漢字約8万5千字を網羅したフリーフォントにこの3字は含まれているので、PDF版ではinDesignを介してこのフォントのグリフを出力することができましたが、EPUBではそうはいきません。

 EPUBで外字を表示するには幾つかの方法があり、EPUB日本語基準研究グループの「EPUB3日本語ベーシック基準」には

外字の使用
EPUB3で、外字を使用するには、
. PNG画像を使用する
. SVG画像を使用する
. SVGフォントを使用する
. WOFFを使用する
という方法がある。
SVGフォントは、運用コストが低いとも言われているが、EPUB読書システムでの必須要件
になっていなこともあるので、現時点では使用を避ける。
理想的な方法はWOFFであるが、現実的なプロダクションを考えると、PNG画像で外字を
作成するのが、現時点では最も汎用性が高い。

などと書かれています。WOFFやSVGフォントは私にはまだ敷居が高いこともあって、なるほどということで、まずPNG画像から手をつけました。

 「EPUB3日本語ベーシック基準」の指示に従って128×128ピクセルの文字画像を花園フォントで作り、Sigilの画像フォルダーにコピーします。例示通りXHTMLとCSSの指定を行うと、それなりに違和感なく文字として表示されます。また、画像をルビタグで囲むことで問題なくルビも表示されます。ただ、ソニーReaderでは文字がかなり右寄りになり、ルビと重なってしまうため、CSSにテキストと画像の並びを指定する「vertical-align : middle;」を加えることで修正しました。iOSのKinoppyでは(わずかに右寄りに表示されるものの)最初から問題なく表示されます。

 さて、これで一応EPUB外字の完成ではありますが、ラスタ形式の画像であるPNG画像の文字は、大きくするとどうしても輪郭にギザギザが出て、やはり仮の物という感じがします。ならば、「ベーシック基準」で次の選択肢になっている、ベクター画像であるSVG画像は使えないかと、Inkscapeなどもいじっているうちに、いつも外字の特定でお世話になっているGlyphWikiから、SVG画像がダウンロードできることに遅まきながら気づきました。花園フォントはGlyphWikiで開発されているオープンソースのフォントですから、当然3つの外字のSVG画像も提供されています。

 さっそくダウンロードしたSVG画像を先のPNG画像と差し替えてみると、さすがにベクター画像、拡縮しても破綻しない外字画像が、ソニーReader・Kinoppyで表示できるようになりました。表示の具合はこんな感じ。

  

 左がKinoppy、右がソニーReader。Kinoppyで少し右寄りになり、書体も各リーダーデフォルトのものとは違いがありますが、とりあえず上出来ではないかと思います。当面はEPUB3の外字は、GlyphWikiのフリーSVG画像で補完というのが、最も簡便な方法ということになるのではないかと思います。

コメント