書籍
素材集
面付けの素
セミナー
Web通販
お問い合せ
LETS入会
DTP-S
>トップページ
CONTENTS
・書籍
・素材集
・iPhoneアプリ作成
・PDF面付けの素
・セミナー
・Web通販
・問い合わせ
・LETS入会案内
・DTP-S


青空文庫テキストをInDesignタグに変換して配置する方法



青空文庫テキストをInDesignタグに変換して配置する方法



 青空文庫テキストをInDesignタグに変換して配置する方法

 InDesignにはInDesignタグという機能があります。レイアウトをタグとして書き出したり、タグを読み込んでレイアウトを作成する機能です。段落スタイルや文字スタイルもタグとして指定できますから、タグを設定して作成したテキストをInDesignに読み込むとそのままレイアウトが完成します。
 
 InDesignのタグはXMLです。というと少し敷居が高くなってしまいますが、タグで指定したテキストに意味を持たせるものです。WebブラウザーのHTMLは基本的にオープンで統一された使用ですが、XMLでのタグは決められたシステム内のみで使うものです。どのような名前のタグでも自由に決めることができます。段落スタイルのタグは

<pstyle:本文>

と指定します。パラグラフ=段落のスタイルという意味のタグです。タグに続くテキストに段落スタイルが適用され、次の段落スタイルをタグで適用するまで段落スタイルが適用されます。ただしここで指定した段落スタイルは事前にInDesign側で作成して指定しておきます。つまり「本文」という名前の段落スタイルがInDesignにあれば、その段落スタイルが<pstyle:本文>で指定されたテキストに、そのまま適用されるわけです。

 InDesignでレイアウトを作成しておき、テキスト内にInDesignタグとて段落スタイルを指定してあれば、InDesign上でレイアウトを指定する必要はありません。テキストファイルをテキストフレームに読み込むだけで段落スタイルや文字スタイルはレイアウトに反映します。



青空文庫テキストをInDesignタグに変換して配置する方法
 

 青空文庫では見出しや字下げなどを決められたルールで指定するようになっています。たとえぱ吉川英治の「三国志(一)桃園の巻」の冒頭には

[#3字下げ]黄巾賊《こうきんぞく》[#「黄巾賊」は大見出し]

という大見出しがあります。これをInDesign上にある「大見出し」という段落スタイルに置き換えるとします。ここでは3つの変換を行う必要がありますが、3つの変換を行うと、テキスト中のすべての大見出しの指定が同時に処理されてInDesignのタグに置き換われます。

 青空文庫のテキストは最終的に

<pstyle:大見出し><cr:1><crstr:こうきんぞく>黄巾賊<cr:><crstr:>

というテキストに変換します。「大見出し」という段落スタイルとルビがInDesignタグに置換されます。そうすればInDesignに取り込んだテキストはルビも反映してInDesignに配置することができます。それでは具体的に解説してみましょう。まず、「[#3字下げ]」を「<pstyle:大見出し>」に変換します。この部分は正規表現は不要です。単に変換するだけです。

 次にルビのある見出し文字「黄巾賊《こうきんぞく》」をInDesignのルビタグにします。ルビタグにする「<cr:1><crstr:こうきんぞく>黄巾賊<cr:><crstr:>」となります。みの場合はルビの変換には正規表現を使います。一般的に次のような検索と置換を行います。

|?([一-龠]+)《(.+?)》 <cr:1><crstr:\2>\1<cr:><crstr:>

 正規表現では一定のテキストパターンを検索します。ルビは漢字に対して適用されますから、([一-龠]+)という文字列で漢字部分を検索します。[...]は文字を指定するときの記号です。ユニコードの「一」から「龠」までの漢字でなおかつ複数でも文字も対象にするので「+」が追加されています。これで一文字以上の漢字のみの文字列を検索できます。

 青空文庫では連続する漢字の後半部にルビを指定する場合は「|(パイプラインとか縦線とかいいます)」で漢字を区切ります。そこで「|」あるいは漢字の文字列のいずれかを選択するために「?」を使います。

 青空文庫のルビ文字は《...》で括られていますから《...》内の文字列を検索します。それが「《(.+?)》」です。「.」は任意の文字列を示しています。(.+?)で一文字以上の文字列が検索対象となります。

 つまり「|」あるいは漢字の文字列があってそれに続いて《...》がある文字列を選択します。この組み合わせの文字列だけを選択します。検索文字列の中で(...で囲まれた文字列は抽出するための文字列です。ここでは漢字の文字列(親文字)とルビ文字を(...)で取り出します。


青空文庫テキストをInDesignタグに変換して配置する方法
 
 次にルビの指定をルビタグに変換します。(...)で括られた文字列を置換文字列に反映します。置換文字列には検索文字列にはない文字を自在に追加できます。つまりここでルビタグを置換文字列に追加します。ここで検索時に(...)でくくった文字列を挿入します。検索文字列の(...)の順番で番号で挿入します。Jeditでは番号の前に「\(半角のバックスラッシュ)」を追加します(一般的には正規表現では「\」ではなく「$」が使われます)。これでルビ文字をルビタグ内において親文字をルビ文字内に配置できます。

<cr:1><crstr:\2>\1<cr:><crstr:>

 InDesignのタグには冗長と略書きがあります。ここでは略書きを使っています。最初の<cr:1>はルビを使うという意味です。「1」という数値がルビという宣言です。<crstr:>はルビ文字を「:」とタグの間に記述します。<crstr:\2>とすると検索時の2つ目の(…)の文字列が「\2」の位置に挿入されます。続いて「\1」で親文字を指定します。<cr:>と<crstr:>はルビとルビ文字のタグが終了したことを指定しています。こうして正規表現では検索文字列の後ろにあっても、(…)で選択された文字列は置換文字列内のどこにでも指定できるのです。

 「[#「黄巾賊」は大見出し]」は不要なので削除します。見出しテキストは一定ではありません。「[#「([ぁ-龠]+)」は大見出し]」というテキストで検索して検索結果をなしにします。ここでは平仮名から漢字の最後までが使われている大見出しの文字列を検索して一括して削除します

 これで青空文庫のテキストの指定はInDesignタグに置き換えられます。それ以外のテキストも同じようにエディタで検索置換することでInDesignタグに置き換えることができます。

 テキストの検索置換は見出しやルビ以外にも外字や傍点などの処理も必要です。ですから、複数の検索置換を順序立てて行う必要があります。そこでJeditを使います。Jeditは複数の文字列で一括して置換できます。正規表現でも一括置換できます。ですから複数の単語での検索置換処理を1つのアクションで行うことが可能です。

 すべての検索置換を一回のアクションで行うことは無理ですが、いくつかのステップにわけて処理すれば確実に青空文庫テキストの注記はInDesignタグに置き換わります。Jeditでは複数一括置換のリストをファイルとして保存しておくと、リストを読み込むことで簡単に検索置換を処理できます。さらに読み込んだリストはメニューに反映されますから、決められた順番に検索と置換を行うだけです。

 下記の実際に青空文庫のテキストをJeditで変換した様子を解説したものです。あわせてご覧ください。

青空文庫テキストをInDesignタグで配置する方法



 青空文庫テキストをInDesignタグに変換して配置する方法

InDesign

 こんにちは、コンテンツ・ワークフロー・スーパーバイザーの上高地仁です。青空文庫テキストをInDesignに配置することが多くなりました。青空文庫テキストをInDesignタグに変換するというようなノウハウはWebで検索すればすぐにわかるだろうと思っていましたが、実際にはわかりやすく整理したものはありませんでした。実際に試行錯誤してやっと使い物になる方法を見つけて整理しました。

 実際にこの方法で青空文庫テキストをInDesignにレイアウトしてみました。テキストをダウンロードしエディタで整形してInDesignに配置するだけです。レイアウトした後版面をチェックする時間も入れて30分もあれば作業は完成します。見出しや傍点、ルビ、外字、外字を含んだルビもあわせて半自動でレイアウトしています。

 インターネットに青空文庫テキストを正規表現でInDesignタグに変換する方法が詳しく乗っていないのは、それほどInDesignタグが使われていないからでしょう。InDesignタグを追加したテキストをInDesignに取り込む時、どのような方法で配置するのがベターなのかはやってみないとわかりません。

 InDesign上でInDesignタグを配置するにはテキストボックスをフレームグリッドにしなければなりません。テキストフレームのまま貼り込むと、文字スタイルは反映しても段落スタイルは反映しないのです。ですから文字物を作成する場合は、まず本文フォントを決めてレイアウトグリッドを作成します。それで段落スタイルを作成し、さらにページ上にフレームグリッドを作成するか、テキストフレームを作成してフレームグリッドに変換します。マスターページ上にフレームグリッドを作成して、ページ上でアクティブにしたフレームグリッドにInDesignタグテキストを配置すると、後ろのページはテキストの分量に合わせてそのまま自動生成されます。

 慣れればめっちゃ便利です。必要な段落スタイルと文字スタイルを決めておいて、テキスト内の注記をInDesignタグに変換すればいいだけです。ややこしいのは外字の指定があり、なおかつルビがある場合です。その場合は少しは処理が面倒です。第3水準第4水準の漢字は面区点で記述されていますが、InDesignでは面区点は読めません。面区点は変換テーブルでユニコードに変換します。ユニコードにすれば、InDesignにそのまま外字として配置できます。

 面区点とユニコードの変換テーブルは探してもありませんでした。そこで作成しました。このテーブルを使って面区点をユニコードにJeditで一括変換します。第3水準第4水準の文字数は3,695文字ですが、複数一括置換するので、リストを読み込んで置換するだけです。変換テーブルがあれば、面区点で記述してあっても、InDesignでOpenTypeフォントを使っていればそのまま漢字としてレイアウトされます。

 青空文庫以外のテキストも同じような形式で記述しておけば、簡単にInDesignタグに変換してテキストを自在に貼り込むことができます。段落スタイルや文字スタイルはわかりやすい形でテキスト内に記述しておけば、簡単にInDesignタグに変換して貼り込むことができます。InDesignでレイアウトしたものもInDesignタグに書き出すと、別のレイアウトに簡単に配置することができます。

 ここでは文字コードにシフトJISを使用しています。現在はJISのX0213も普及も進み字形の多いOpenTypeフォントも少なくありませんから、シフトJISでは使えない外字もテキストエディタで簡単に入力可能です。その場合はInDesignタグもシフトJISではなくユニコードで配置することが可能です。

 青空文庫がシフトJIS対応なのは、古いシフトJISにしか対応していないOSやアプリケーションに配慮してのことです。シフトJIS内の文字コードで記述しておけば文字が化けてしまうことにはなりません。エディタでの表示は別にしてアプリケーションで表示する場合は、外字部分の注記をアプリケーションで読み込んで文字コードに変換すれば外字も問題なく表示可能です。ですから青空文庫形式で記述してもテキストのソースとしては汎用性はけっして低くありません。

 『青空文庫テキストをInDesignタグに変換して配置する方法』は青空文庫テキストをエディタの機能で効率的にInDesignタグに変換する具体的な方法を示したものです。外字の多い吉川英治版「三国志」全巻を変換して動作を確認しました。

 必要なアプリケーションは

InDesign CS6(CS4以降)
Jedit X 1.4以降

となっています。InDesignはCS6でなくてもCS4以降であればまず問題ありません。InDesignタグの機能に大きな機能追加はほとんどありません。InDesignタグの内、段落スタイルと文字スタイル、外字を読み込むときのユニコードのタグが読み込めればまったく問題はありません。エディタはMac版では複数の単語で一括置換できるものはJeditしか見当たらないので、Jeditをお使いください。

 青空文庫のテキストであればマニュアルの手順にあわせて、Jeditで何度か変換してシフトJISで保存し、InDesignでテキストを配置するだけです。面区点をユニコードに変換するテーブルも用意しています。



『青空文庫テキストをInDesignタグに変換して配置する方法』は次のものからなっています。

■ 青空文庫テキスト変換用ファイル

 青空文庫テキストを複数一括置換するためのテキストファイルです。Jeditでは検索文字列と置換文字列をタブで区切ったテキストを読み込むと複数一括置換ができます。複数一括置換ファイルを順番に適用することで、青空文庫テキスト内の注記をInDesignタグに変換できます。それぞれのファイルの使い方はマニュアルをご覧ください。この中には第3第4水準の面区点をユニコードに変換するテーブルも含まれます。


■ 『青空文庫テキストをInDesignタグに変換して配置する方法』マニュアル

 InDesignのレイアウトの作成方法とテキスト変換の手順をわかりやすく解説しています。変換手順にあわせてカスタマイズすることで、青空文庫以外のオリジナルのテキストでもInDesignタグに変換可能となります。

青空文庫テキストをInDesignタグに変換して配置する方法


目次

第一章 InDesignタグで青空文庫テキストを配置する

1-1 InDesignタグをテキストに指定して取り込む
1-2 青空文庫の注記を正規表現でInDesignタグに置き換える


第二章 InDesignでテンプレートを作成する

2-1 グリッドでマスターページの作成する
2-2 段落スタイルと文字スタイルを作成する


第三章 Jeditで青空文庫テキストを検索置換する

3-0 Jeditでできる正規表現での複数検索置換
3-1 テキストの不要な改行を削除する
3-2 テキストの不要な空白スペースを削除する
3-3 第3水準第4水準ユニコード指定文字を変換する
 第3水準第4水準の面区点だけを取り出す
 ユニコードの番号のみを取り出す
3-4 青空文庫のルビと傍点をタグに変換する
 外字を含んで漢字をルビタグに変換する
 傍点の指定をInDesignの文字スタイル変換する
3-5 第3水準第4水準の面区点コードを整形する
3-6 第3水準第4水準の面区点をユニコードに変換する
3-7 二点ダーシと置き換え文字を置換する
3-8 大見出しや中見出しを段落スタイルに置換する
3-9 冒頭にシフトJISを指定してCRで保存する


第四章 InDesignでレイアウトを仕上げる

4-1 InDesignにテキストを配置してページを生成する
4-2 置換されなかった文字を検索する
4-3 漢文の返り点をInDesignで作成する



 



 正規表現は少し学べは簡単に身に付きます。実際に検索テキストを作成して置換して見ればどのような仕組みなのかがわかるようになります。毎日少しでも触っていれば誰にでも使えるものです。検索したいテキストのパターンが見えるようになれば、どのようにすればいいのか理解できます。正規表現というより「パターン置換」といった方が実際的でしょう。

 青空文庫は汎用性を考慮してシフトJISで過去の作品を共用するための仕組みです。テキストをアーカイブするフォーマットして広く使われるようになっています。原稿用紙を使っていたときは、ルビや傍点は原稿用紙に直接指定できましたが、データ入稿の場合は、テキストデータにその指定が必要です。それらの指定はルール通りになっていれば、簡単なInDesignタグに変換できます。まずは青空文庫のテキストで試してください。青空文庫テキストをInDesignタグに変換する程度であれば、複雑な正規表現の指定は必要ありません。押さえるべきポイントさえ間違えなければ、正規表現でInDesignタグに変換するのはけっして難しくありません。あなたでも簡単に扱うことが可能です。



EPUB



OpenOffice Writer


InDesign 『青空文庫テキストをInDesignタグで配置する方法』プリントアウト版


『青空文庫テキストをInDesignタグで配置する方法』はPDFでのご案内ですが、ご希望の方のみテキストのプリントアウト版を同梱いたします。青空文庫テキストを正規表現でInDesignタグに変換する作成方法をいち早くご理解いただくために、テキスト本文のプリントアウト版を同梱いたします。A5サイズでプリントアウトし中綴じして製本しています。




InDesign48時間以内の決済でメール便送料無料


対応マーク

お申し込みいただくとすぐにダウンロードいただけます。決済はPaypalもしくは銀行や郵便局で48時間以内にお願いいたします。

テキストPDFとテンプレートの含まれたメディアとプリント版はのちほどメール便でお届けいたします。

*現在のお申し込みはメール便のみとなっております。


現在は予約申し込みとなっております。48時間以内に決済をお願いいたします。リリース後は価格が変更されます。お届けはマニュアルが完成してからとなります。



InDesigniPhone用とiPad用のInDesignテンプレート


青空文庫テキストをInDesignに実際に取り込むためのInDesign CS4のファイルです。InDesign CS4以降でお使いいただけます。ページ上にカーソルを置いてファイルメニューの配置で整形したファイルを配置してみてください。すべてのテキストが一気に配置される様子をご覧いただけます。


InDesign3ヶ月メール無料サポート


お申し込み後3ヶ月以内は無料でメールサポートいたします。疑問点やお気づきの点があればご遠慮なくお問い合わせください。





青空文庫テキストをInDesignタグで配置する方法
青空文庫テキストをInDesignタグで配置する方法
『青空文庫テキストをInDesignタグで配置する方法』
上高地 仁 著/A5/2013年12月10日初版/インクナブラ 刊行

OpenOffice WriterマニュアルPDFと変換用ファイルが収録されたCD

販売価格:4,990円
一般価格:4,990円 DTP-S倶楽部会員価格:1,000円
 
 



●送料メール便のお申し込みは下記Webフォームからのお申込みください


インクナブラ電子書籍作成ツール
■ご希望の書籍・ツールをチェックして数量を入力して下さい。

製 品 名
販売価格(税込)
数量
青空文庫テキストをInDesignタグで配置する方法:4,990円
4,990円 
  iPhoneアプリ作成ツールSakuttoBook
→お申し込みはこちらから  



■下記フォームはメール便での配達する場合のお申し込みとなります。
トラック便では現在お申し込みいだけません。メール便のみです。

■各フォームに記入のあと、「書籍・ツールを申し込む」ボタンを押してください。(*は必須です。)
■*は必須項目ですので記入漏れがないか、もう一度ご確認ください。

     

貴社名

お名前*

ふりがな*

郵便番号*

住所*
※マンション・ビル名、部屋番号までご記入願います。

E-Mail*
半角英数でご記入下さい。アドレスはくれぐれも間違いのないようご注意ください。

Tel*
※お届け時にご連絡可能な電話番号の記入をお願いします。

お支払い方法*
※Paypalで決済される場合は、のちほど決済リンクをメールでお送りいたします。銀行・郵便局での振込先は返信メールに記載しております。いずれも48時間以内に決済願います。メール便はのちほどお届けいたします。銀行・郵便局での決済では、振込手数料はご負担願います。

ご請求方法*
注意)代金引換の場合は弊社では佐川急便との二重請求になるため請求書・領収書を発行いたしません。
領収書が必要な場合は、引き替え時に佐川急便の配送ドライバーの方にお申し付けください。
代金引換の商品明細を希望される場合は「明細書」を選択してください。

プリントテキスト
※テキストのプリント版を希望される場合は、必ず「プリント版を希望する」を選択して下さい。

DTP-S倶楽部*
コンテンツ・ワークフロー実践会DTP-S倶楽部に同時にご入会いただきますとDTP-S会員価格にてご購入いただけます。

メッセージ



*インクナブラ書籍・ツールは実用的なものばかりです。いますぐお申込ください。
 


 


InDesignを使うのであれば
正規表現は必須科目です。

 InDesignを効率的にお使いいただくには、正規表現は必須科目です。基本的な仕組みがわかれば決して難しくありません。青空文庫テキストがどのようにしてInDesignタグに変換されるのかがわかれば、自由に応用して使うことができます。

 まずは使ってみることです。変換に必要なファイルはすべて用意しています。実際に手順に従って変換すればその仕組みは、手に取るようにわかります。最初はすこし取っ付きにくいところはありますが、そのハードルさえ越えれば本当に簡単です。是非トライしてください。


今すぐ上記のお申込フォームからお申込みください。




ご意見・お問い合わせはこちらから