XRミーティング 2023-09-20 で登壇してきました。自分のまとめです。
イベント情報
【北海道オンライン会場】XRミーティング 2023/9/20 #XRMTG 【zoom接続】 – connpass
https://connpass.com/event/294946/
XR(AR/CR/MR/SR/VRの近未来技術)に関する情報共有や自作アプリのお披露目ができる場
としてイベントを開催します。ある程度顔の見える人数でXR技術についての情報発信や意見交換をしませんか? 登壇者の話を聞きつつ気軽に会話しながらXR技術についての知見を深めましょう。
大阪駆動開発 主催の「XRミーティング」と中継でつなぎ、関西・関東・北海道・福岡・神戸の5拠点を中心に、距離を超えて知り合いになる事が出来ます。
クリエーター・エンジニア・デザイナーはもちろんのこと、それ以外の方や初めてお越しになる方も、お気軽にご参加下さい。
ということで、今回は XREAL Air で録音して Whisper API で文字起こしした試行錯誤を話してきました。
スライド
スライドはこちらです。
「XREAL Air で録音して Whisper API で文字起こしした試行錯誤」ということで、XREAL Air での音声認識まわりを話してきました。
当日の様子
できたー!XREAL Air のマイクで音声録音したデータを OpenAI API の Whisper API に送って日本語で文字起こしして受け取れました~。これでいろいろな仕組みにつなげられるます! #AR #XREAL pic.twitter.com/Dr5avY1z7b
— Tanaka Seigo (@1ft_seabass) September 12, 2023
おおまかには、こちらのネタです。
確かにHoloLens 2含めてWindows系は音声認識系でかなり便利な印象あるので、他デバイスだと?ってなりますよね。Audio Clip周りってHoloLens 1の時にCognitive Serviceで四苦八苦したことあったのをふと思い出した。なんか頑張ってバイナリを解析したなぁ。#XRMTG pic.twitter.com/xep6DjzkIv
— takabrz1 (@takabrz1) September 20, 2023
まさに、このあたりを頑張ってきた話をさせていただきました。気づいていただいてうれしいです!
#XRMTG
XREAL Airの固有のところは少なかったほうらしい文字起こししたものをいろんな機能に送り込むような使い方を広げられそう
88888888 pic.twitter.com/DR7tBN0Wtp
— じゅん@9/17-26熊本・福岡滞在 9/20XRMTG北海道のお世話 5/8💉6 (@jun_mh4g) September 20, 2023
一つ一つのステップを話しつつ、詳しい中身はブログに記事で書いてあったので、テンポよく話すことができました!
- Unity からマイク録音して音データを WAV フォーマットに保存するメモ – 1ft-seabass.jp.MEMO
- Unity からマイク録音して音データを WAV フォーマットで Whisper API に送って文字起こしするメモ – 1ft-seabass.jp.MEMO
- XREAL Air からマイク録音して音データを WAV フォーマットで OpenAI Whisper API に送って文字起こしするメモ – 1ft-seabass.jp.MEMO
8月の XRミーティングで言っていた「やりたかったこと」にだいぶ近づいていてうれしいです。今回もありがとうございました!ひきつづきやっていきます!