Macで「音声認識字幕ちゃん」を使いやすくする。


「音声認識字幕ちゃん」のサイズ調整

下の動画を別ページで表示します。

字幕一覧(クリック)

(00:00:01) 今回は「音声認識字幕ちゃん」のですね。
(00:00:10) サイズを調整する、というテーマでやっていきます。
(00:00:15) 「音声認識字幕ちゃん」はですね。
(00:00:18) Google Chromeでしか起動できないのです!
(00:00:23) で、このhttps以下ここにある、
(00:00:30) これを入れて立ち上げるのですが、そうすると下のように、
(00:00:38) ホームページが出てくるのですが、
(00:00:41) この中で、Google Script API-KEYがありますが、
(00:00:46) ここに、API KEYを入れるんですね。
(00:00:52) それはちょっとまた別の場面で、ここのURLからですね、
(00:00:58) 設定方法を見て、取得して入力してください。
(00:01:05) それは今回は説明しません。
(00:01:13) それで、まず、
(00:01:15) Google Chromeを、表示するのですけれども、
(00:01:20) Google Chromeから、
(00:01:22) 「音声認識字幕ちゃん」を表示するのですけれども、
(00:01:27) それが、OBSの画面上のどの位置に配置するか、
(00:01:33) どの大きさで配置するか、というのは、
(00:01:36) 人によって様々だと思いますので、
(00:01:42) それに合わせるために、
(00:01:45) ウィンドウサイズを、
(00:01:47) 色々変えれるようにしておく必要があるんですね。
(00:01:51) それでこのプラグインを入れます。
(00:01:55) Window Resizerというものです。
(00:02:01) Chromeウェブストアから拡張機能を選んで、
(00:02:07) その中で検索のところに、
(00:02:11) Window Resizerと入れて、このアプリケションを探して、
(00:02:19) それでダウンロードしてください。
(00:02:26) で、次にWindow Resizerの設定をします。
(00:02:31) すでに既定値として、ご覧のように320以下ですね、
(00:02:38) この1920までが既定値としてあるのですけれども、
(00:02:43) サイズのですね、
(00:02:44) ところがやっぱり私としては、
(00:02:48) OBSの画面の右下のところに、翻訳が出るなら出したいので、
(00:02:54) もうちょっと小さいサイズのものを作りたいです。
(00:02:58) そこで819 x 614というものを作りたいと思うので、
(00:03:04) 自分で作ります。
(00:03:07) このpresetsのところの、+のところを押して、
(00:03:12) そうすると別の画面に移行して設定ができます。
(00:03:16) で、それの設定が済みますと、
(00:03:19) このpresetsの一番上段のところに、
(00:03:23) 今設定した新しいものが出てきます。
(00:03:34) Window Resizer設定のもう一つです。
(00:03:39) それは、hotkeysでpresetを設定します。
(00:03:46) presetの上から、
(00:03:49) presetが1,2,3,4,5...と順番が付いてますけども、
(00:03:54) これが先程のこの順番と対応してます。
(00:04:00) 従って、
(00:04:01) 今私が作った819 x 614は、
(00:04:07) この下の、Resize to preset 1 に対応しています。
(00:04:13) 従って私はここに、登録しました。次に。
(00:04:25) もう一つ準備することがあります。
(00:04:29) Google Chromeで、
(00:04:31) 「音声認識字幕ちゃん」を起動させるための、
(00:04:35) Appleスクリプトが必要になることです。
(00:04:40) それは既定ブラウザをChromeにしていない場合も多いためです。
(00:04:51) スクリプトは簡単です。
(00:04:54) tell application "Google Chrome"
(00:05:00) activate open location
open locationの後は、
(00:05:05) 「音声認識字幕ちゃん」のURLを入れます。
(00:05:11) そして、end tell です。
(00:05:19) その設定したものを、Stream Deckへ登録します。
(00:05:26) Stream Deckで、マルチアクションという形で登録します。
(00:05:30) 一つ目は、Chromeで、
(00:05:33) 「音声認識字幕ちゃん」を開くAppleスクリプトです。
(00:05:40) 二つ目は開いたChromeのサイズ合わせをします。
(00:05:48) 先ほど設定したホットキーです。
(00:05:56) 以上で設定は終わりです。
(00:06:00) で、Stream Deckからそのマルチアクションを起動します。
(00:06:05) そうすると下のようにですね、Chromeが立ち上がります。
(00:06:12) 最初に立ち上げた時は、
(00:06:14) マイクの使用がまだ許可されてないと思いますので、
(00:06:18) それを許可します。
(00:06:21) そうすると以下のように表示されます。
(00:06:24) おはようございます
(00:06:26) Goog morning、早上好。
(00:06:30) 既にですね。第一翻訳語として英語、第二翻訳語として中国語を設定してあります。
(00:06:38) なのでこういうふうに出てきます。以上で準備が終わりまして、
(00:06:49) 次のステップはこれをOBSへ取り込む、
(00:06:54) そういう流れになります。


最近、ちまたでもスマホの翻訳アプリ、翻訳機器などを目にすることが多くなってきました。しかも同時翻訳までできてしまうのには驚きです。ただ、いざ使おうと思うと、最初はお試しで無料ですが、有料に誘われます。しかもこの翻訳系のサービスは、サブスクが殆どで、毎月料金が発生する形になります。しかもその提供会社はたいていは海外の会社でUSドルベースが多く、円支払いでは毎月3000~5000円などと高額になり、趣味の域を超えます。

今回紹介する「音声認識字幕ちゃん」は、大学の教員をされている西村良太さんが個人で開発され一般に公開されている、「Webベースの、文字起こし+同時翻訳アプリ」です。大変使いやすくしかも無料です。西村さんには感謝申し上げます。

このサイトで提供されている起動用アプリですが、Windows用のbatファイルは直接に動作するので使いやすいですが、Macはそのままクリックしても動かずシェルスクリプトでアプリ化して動かしました。

MacのAutomatorを起動→アプリケーションを選択→シェルスクリプトを実行を選択→「音声認識字幕ちゃん」からダウンロードしたmac用起動ファイルjimakuChan_nonStop.commandをテキストエディタで開く→最初の#!/bin/shの部分を除いて、Automatorへペースト→xxxxxx.appを作成。

Macは一手間増える感じもありますが、異なる設定条件の複数の字幕ちゃんを起動できるのは素晴らしいことです。

但し、OBSに組み込んで使う時などは、都度、翻訳なしにしたり、言語を切り替えたりすることもありそうで、そうした自由度は、Webベースの中で、設定を変更できる方が、都合がいいと思い、今回は、Webをそのまま使うような流れを考えてみました。

但し、日本語の認識、及び、翻訳のレベルは、それほど高いとは言えず、語学を勉強された方からすれば、不満でしょう。標準語でゆっくり話す必要があります。またネットワークの状況で認識の感度が振れます。補助的な用途としてであれば、使い物になるでしょう。

ポイント解説

ビデオを補足します。

1 「音声認識字幕ちゃん」はGoogle Chromeで起動する。

同時翻訳を行う場合は、Google Script API-KEYが必要です。その取得については、

音声認識字幕ちゃん・チャット翻訳ちゃん(西村良太)
認識ちゃん・翻訳ちゃん(西村良太)

の説明に従ってください。

2 Google Chromeの起動時のウインドウサイズを固定できるようにする。

「音声認識字幕ちゃん」の緑色の字幕欄を、OBSでウインドウキャプチャーして、読み込むことを想定していますが、もともとブラウザは、自由にフニャフニャとウインドウサイズを動かすように出来ているため、それを固定させるのが起動用アプリのわけですが、設定変更の自由度が欲しいのとMacの場合の手間の多さから、ブラウザの中の緑色の字幕欄のサイズを固定させて、ブラウザの中で、フォントを変更するようにしたいわけです。

そのために,ウィンドウサイズを自由に追加登録して、それをホットキーで選択できるプラグイン、Window Resizerを使います。

3 「音声認識字幕ちゃん」を起動させるためのAppleスクリプトを作る。

私の場合は、既定ブラウザはSafariにしています。確かに、Safariでは、「音声認識字幕ちゃん」の文字起こし翻訳が起動しません。「音声認識字幕ちゃん」のURLはChromeと紐付けする必要があります。

Appleスクリプトは簡単です。

4 Stream Deckへマルチアクションとして登録する。

二つのアクションを登録します。一つ目は、Chromeで「音声認識字幕ちゃん」を開く、Appleスクリプトです。二つ目は、そのChromeのサイズを合わせるアクションです。私はStream Deckを使いますが、他にもホットキー、ショートカットを登録できるアプリがありますので、活用ください。

5 Stream Deckからマルチアクションを起動する。

Webベースで起動すると、後から簡単に変更ができるので便利です。翻訳言語の変更削除、フォントの変更などがラクです。

6 まとめ

器材記録

音声認識字幕ちゃん
Google Chrome
Window Resizer ( Chromeプラグイン)
Mac スクリプトエディタ
Stream Deck

Adobe Character Animator(スターター)
Final Cut Pro
Vrew(無料)
フリーボード
Mac mini M2
BGM: オリジナル音楽

以上です。

↑広告-Google AdSense-