1. 無料アクセス解析
プロフィール

五枚重ね

Author:五枚重ね
備えあれば憂いなし

mail:
gomaigasane(@)gmail.com
…(@)は@に置き換えで

最近の記事
最近のコメント
最近のトラックバック
月別アーカイブ
カテゴリー
FC2カウンター
ブロとも申請フォーム
ブログ内検索
RSSフィード
リンク
スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


スポンサー広告 | 【--------(--) --:--:--】 | Trackback(-) | Comments(-)
Xbox360版アイドルマスター テキスト抽出メモ
ほぼ完全な形で音声抽出ができたので、360版アイマスの解析話はひとまず終わるつもりだったが
思いつきで試したらコミュパート等のテキストを読み込めたので、軽くメモしておく。


<<とりあえず読み込む>>
前々回のメモなどに基づいて、ゲームディスクからボイスデータをリッピングしておく。

後は特に変換などの必要は無く、適当なテキストエディタで各ファイルを読み込むだけ。
ただし、秀丸やWordのように文字エンコードの種類を任意に変更できるエディタが必要。
文字エンコードを「Unicode(Big Endian)」にして読み込むと、大部分は文字化け状態になるが
目的であるコミュパートのテキストや、選択肢項目のテキストが読める状態になる。

うまく読めるかどうか試すには、etcフォルダ内のサイズが小さいファイル群がいい。
各アイドルとのコミュパートについては、ボイスデータが混在していてサイズが大きいので
読み込みにやや時間がかかるのと、目的のテキストを探すのが大変なのが問題。


<<まとめ駄文と今後の目標>>
「ボイスデータと同じファイル内にテキストも含まれているのでは」
という予想が当たっていたのは非常に嬉しい。やったね。
まあ、フォルダ名が"script"って時点で誰でも考えそうなことではあるけども。
なまじAHXヘッダなどがShift-JISで普通に読めたから、というのもあるが
文字エンコードの変更をすぐに思いつかなかったあたりはまだまだ未熟だな。

しかし現状では、目的のテキストを参照するために手間がかかりすぎるので、
音声のように適当なファイル単位に区切るか、せめてテキスト部分だけの抽出を行いたい。
そう思ってバイナリエディタでデータを眺めてたら、大体のアーカイブ構造が分かってきた。
その際に大変参考になったサイトがこちら。アイマスは大体パターン(a)に該当。

細かいアーカイブ構造については、また別エントリにまとめようかとも思うが
説明しにくい割りに、賢い人・解析慣れしてる人には簡単すぎる構造だろうからどうしたもんか。

と、いうわけで、音声や画像のデコードといった複雑なことは先人の知恵に頼るとして、
仕組みが分かってきたアーカイブからの音声・テキストの個別ファイル切り出しについては
プログラミングの勉強も兼ねてチャレンジしてみようと思う。
CにしてもPerlにしても「まずは"Hello, world!"」より少しかじった程度のレベルなので
恐ろしく時間がかかるだろうが、ちょっと解析が面白くなってきすぎたので頑張ってみよう。

頑張ってる間にプログラミング慣れした人がサラッとツール作っちゃったりして。
ユーザ数万人いるんなら、他にもアイマスの解析やってる人いないのかなぁとぼやいて〆。


    [関連記事]:Xbox360版アイドルマスター音声抽出メモ
    スポンサーサイト


ゲーム(コンシューマ) | 【2007-02-27(Tue) 05:39:57】 | Trackback:(0) | Comments:(0)
コメントの投稿
管理者にだけ表示を許可する

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。