日本最初の合成音声
Ғылым және технология
1959年(昭和34年)に、電子音によって発声するタイプの日本最初の音声合成装置が、郵政省電波研究所(現・情報通信研究機構)によって開発されました。この動画では、当時の合成音声と、その開発の意義をご紹介します。
当コンテンツは、2021年5月15日にBSフジで放送された「もしもで考える…なるほど! なっとく塾」“もしも声を自由に変えられたら? ” の中で引用されました。
この合成音声を開発した鈴木誠史博士(元郵政省通信総合研究所所長)は、90歳になる現在(2023年)も、簡単な科学実験動画を製作して、ご自身のKZreadチャンネル(以下)で公開されています。
/ @user-ep6yc8hc8w
Пікірлер: 988
60年以上も前なのに結構まともな音声やね。
@user-yj6uq6bw5w
10 ай бұрын
技術が停滞してるだけ
@user-lj5cc9cg6l
10 ай бұрын
@@user-yj6uq6bw5w停滞してるって色んなコメで必死に打ってる君可愛いね♥️♥️♥️
@user-you_are_an_idiot
9 ай бұрын
60年前を舐めすぎやろ😂
@nulla1237
9 ай бұрын
ゆっくりボイスよりも綺麗に作れてるやんか
@sumaho_de_MikuMikuDance
9 ай бұрын
@@user-lj5cc9cg6l え、、、
60年以上前の技術なのに,想像以上に実用に耐える音声でびっくりした 技術者の人には尊敬しかないな
@user-yj6uq6bw5w
10 ай бұрын
技術が停滞してる証拠
@ike3563
10 ай бұрын
停滞も何も、チューリングテストに合格してる事例があるんだから、ほぼこれ以上ない領域まで進化しちゃったんだよな。 だから今度はハードウェア、ユーザビリティ、悪用防止、等の方向に開発が広がっていってるわけで。 逆に君はどこ目指してるのって話。
@ma2mani
10 ай бұрын
@@user-yj6uq6bw5w これ以上に何があるんや?頭のバージョンアップを君はすべきだね
@naiChaSanJieMeid
10 ай бұрын
こんなクソ音声で実用に堪えるはまじで草
@taueman8
9 ай бұрын
@@naiChaSanJieMeidお前らオタクは萌え萌えキューン♡みたいな声を求めてるんだろうが人が話さなくても入力すればしゃべってくれるってのはそれだけで便利なんだよ。
途中で出てくる「ええ、そうです」というのが亡くなった伯父そっくりの声質とイントネーションでびっくりした。 他の言葉も昔の東京の人の発音に近いように思います。 聞き取り調査が東京でやったものなら当時の東京の人の発音に近くなっても不思議ではないのですが。
@youtubeofficialchannel6380
11 ай бұрын
こういう証言があるのも面白いなぁ
@user-ou7se7dq4k
8 ай бұрын
いつの間にか当時の発音を残せたわけですね。
これが今じゃ歌歌えるようになったのか…
@チーズミノタウロス迷宮の陰キャ
8 ай бұрын
もうすぐでもう人間と聞き分けがつかないな。
1959年の時点で「や」「わ」「おはよう」などと聞こえるような高度な合成音声を作り出せたとは!音声合成技術にもやはり歴史があったのね。
こっからゆっくりやボカロに進化したって考えるとすごい感慨深いな
@user-hs3up2bt1z
11 ай бұрын
ボイロも入れろ
@sinanokazesayaka
11 ай бұрын
@@user-hs3up2bt1zおっせーやな(適当)
@Anonymous-eq3by
11 ай бұрын
@@user-hs3up2bt1z一気に知名度落ちたわ
@nakamigi1089
11 ай бұрын
@@user-hs3up2bt1z数多ある合成音声の名前なんていちいち入れてられるかよ
@koppunsyuraba
11 ай бұрын
@@Aventador_lbwk結月ゆかりやきずなあかりなどの合成音声シリーズの略ってところですかね?元はボイスロイドです
なんかこの合成音声聴くとトモコレを思い出してしまう
@nomuknk
2 жыл бұрын
コクハクシタ↗︎イ→ノデスガ
@星町すいせい
2 жыл бұрын
〇〇のそっくりさん、こんにちわ!
@Theコラム
Жыл бұрын
わた↑しと付き→合ってく↓ださい
@Chinese_eel
Жыл бұрын
@@Theコラム ご め ん な さ い ( 絶 望 )
@Eringi_Shumai-KEN
11 ай бұрын
先に言われた……(´・ω・`)
この時代のパソコンで遠隔操作使って合成音声で「呪ってやる」とか「ここから出して」とか流されたら誰だって呪われたって思うでな
@user-bz1qj8lq8l
2 жыл бұрын
そのスレのまとめ動画から実際のBeepを聞きにここへ来ました^^
@user-pv6dy1fk4h
2 жыл бұрын
@@user-bz1qj8lq8l おぉ同士よ
@user-jl7jk2gl8r
2 жыл бұрын
@@user-pv6dy1fk4h ナカーマがいた
@tonkatuteisyoku
2 жыл бұрын
???「同志よ……」
@popeka
2 жыл бұрын
同じく。 聞いてみると納得の音声ですね
言語として成立してない単母音の連呼から始まって、短い単語を自分の能力を少しずつ確認するかのようにたどたどしく発音するの、ゲームに出てくる明らかにヤバいラスボス格の羽化シーンすぎる
初見だから音読さんが日本最初の合成音声だと思って感動しちゃった
なんだか、ぎこちなく喋るロボットみたいで応援したくなるな。
@user-djudgphp2f
5 ай бұрын
弱いロボットっていう研究がありまして、興味があればググってみて下さい。ロボット自体に能力がなくとも、人間の庇護欲を利用して人間にやってもらえたら…という考えです。
この声でおはようって起こされたら心臓飛び出るぐらいビビるわ
でかい機械だったものが今じゃ個人の小さい機械の中でできるし波形接続以外にもHMM方式やNNWを利用した合成が出たりと技術の進歩を感じる
この声を遠隔で流されたらそりゃトラウマになるわな
@cnr8796
2 жыл бұрын
お主もか!我が同志よ!
@user-xn3qb9ob3t
2 жыл бұрын
君らもあのスレの話を聞いた人か!
@boymilk8907
2 жыл бұрын
多分同じ動画orスレ見たんだな
@user-rn9iv1mc4y
2 жыл бұрын
仲間発見!
@user-pq9fn6xs9l
2 жыл бұрын
同士いたぁww
合成音声がこんなに前から作られていたことに驚き! けっこう日本語として聞こえる!すごい!
こんな昔から開発され始めてたとは凄い。 何となく70〜80年代くらいにできた技術かと思ってた笑
@user-gz4hk8op1z
11 ай бұрын
とちらにせよ昭和に開発されてるのが驚くマジで だってその割にはアナウンスとか合成音声になったの最近でしょ?
@kunugi_chestnut
11 ай бұрын
NPO科学映像館の「シュミレター」(誤字)で50年ほど前の小学生がテレビで算数の問題を解く映像があったけど、そういう教材がすぐに普及はしなかったのを見るに、コストとか社会の慣れって大きいよな
@frosty999ful
11 ай бұрын
そもそもコンシューマーエレクトロニクスに於いて 真空管がトランジスタに置き換わる トランジスタからICやLSIにたどり着くまで 各々15年ほど掛かって(買った消費者もスゴいw) 今の超絶レベルのマイクロエレクトロニクス 汎用CPUインテル8080の設計者は日本人 ワンチップ汎用CPUのアイデアも元は日本の電卓メーカー
@user-mo1me4io5j
11 ай бұрын
燃えプロとかあんな小さなチップであれだけの声をだしてたしね
@user-lz9kf1ci5c
11 ай бұрын
@@user-gz4hk8op1z 日本は世界屈指の技術大国だったからね。アメリカに消されたけど。
合成音声を合成音声で解説するのが実に面白いw
@user-rt7ji6ti4r
10 ай бұрын
二つを比べてみるのもこの動画の醍醐味ですね
論文を書いた開発者が動画の監修をしてるのがまた凄い
@seika_beginner_4888
11 ай бұрын
学会「この理論を作ったのは私ですが...」
@7gfkkgcvbnj
10 ай бұрын
ほんとだ!鈴木誠史という方ですね。 開発時30歳として、いま93歳・・・生き証人だ。
@user-ht1ez9ss4y
10 ай бұрын
素人質問で恐縮なのですが
「音と声の境界」って繊細なんやねえ。
最初のものでも、大正・戦前期のラジオくらいの音質だから、結構凄いと思う。
@Kei-IWA_Siliconated
11 ай бұрын
それを今聞ける理由は保存メディアがあったからで、つまり同じような磁気テープやレコードディスクをこの装置も積んでいるからですね。>音質
@Sotetsu21108f
11 ай бұрын
@@Kei-IWA_Siliconated保存メディアや記録媒体の進化も 感動的ですね。
当時の開発者は実況や茶番劇に使われるとは思ってなさそう
@tomaaa9985
11 ай бұрын
ましてや、 なんの功績も残していない馬の骨に勝手に商標登録されるなんて、 この音声の開発者が知ったらさぞかし悲しむだろうなぁ
@ItibayNeko
11 ай бұрын
@@tomaaa9985 あれはまた…別や。ヤツが登録しようとしたんは「特定の動画フォーマット」であって「電子音声技術」やない。 「SofTalk」を登録したとかなら、それこそ化けて出られかねんがな。
@subeana_okage
10 ай бұрын
@@tomaaa9985あうん
携帯電話の音声って、通話者の声に似せて作られた「合成音声」だったのか。 最初の頃は、合成音声の母音がビープ音のような音だったのと比べると凄い進化ですね。 ICが無かった時代、ちょっとした事をする回路をトランジスタでもなく真空管で組むと巨大ですね。
@toyo-rex4899
11 ай бұрын
携帯電話の音声が「合成音声」であるくだり、先月末の「チコちゃんに叱られる」内で、「なんで携帯電話の声はいつもと違って聞こえるの?」→「あなたの本当の声ではないから」という答え合わせで詳細に解説されていましたね。
@OmoriSousuke
11 ай бұрын
うそ電話詐欺で孫を装ってもバレにくいのは 耳が遠くなった以外にも要因があったんだなあ
@user-lb6yf6ez9s
11 ай бұрын
母に電話かけた時自分と妹で「あんたらの声どっちがどっちか分からん」って言われてたのはこういう事だったのか
@nipul1967
10 ай бұрын
>ちょっとした事をする回路をトランジスタでもなく真空管で組むと巨大ですね。 普通の電卓(関数電卓とかじゃなくて)を真空管で作ると体育館ほどの大きさになり、発電所が直に必要なほどの電気が必要で、真空管電卓の沢山の真空管の一本でも切れればまともに動かない・・・らしいw
興味深く見させてもらいました。この技術の延長に今日の音声合成や、またMP3のような音声データ圧縮などもあるのだな、と思うと、感慨深いですね。
初の技術ってもうちょっと拙い感じかと思ったけど普通に聞ける感じなの凄い
最近個人が開発した中の人が居ない音声合成ソフト『足立レイ』とかなり似てるから似た仕組みなんだろうなぁ
てことはゆっくりボイスとかめっちゃ凄いんだなぁ
@RIPPYSTUDIO
11 ай бұрын
あら!!
@user-vl2mb4xi2m
11 ай бұрын
フリーで何でも言わせられしな。
@motokinto
11 ай бұрын
しなしーな
@kikyozakura
11 ай бұрын
@@user-vl2mb4xi2mライセンスがあることをご存じで?
@kbtit_9315
11 ай бұрын
あの軽さはやばいわ なあずんだもん(低スペ民)
口腔の再現って、結構急峻なピーク/ディップを持った「次数の高い」フィルターをスウィープする必要があるので、それを最初に作った人は尊敬します。
@KubotosinariKabusikikaisha
11 ай бұрын
膣つきてぇ〜
@winpolluxfs9899
11 ай бұрын
すごいねー😂😂
@Akita_ken2236
10 ай бұрын
たしかに「次数の高い」フィルターはアイデンティティでプロットすることがエッセンシャルですもんね。それをファーストでメイクしたヒューマンはリスペクテッドすべきです
@Anal_Desert
10 ай бұрын
オフチョベットしたテフをマブガッドしてリットにする定期
@user-denshikousaku_staygold
Ай бұрын
人間の口ってエグいくらい 帯域が狭くて高性能な周波数フィルタ だから電子回路で再現するの 大変なんだよな…
PC-6001mkIIなどに搭載されていたICが、この装置の子孫にあたる様な実感がありました。 という事は、この装置は現在の全ての日本語合成音声のご先祖様と言って良い存在なのでしょう。
@restoreyan
11 ай бұрын
PC-6001mkII持っていましたがまさにこの系譜の声、って感じでしたね。抑揚がなくモゴモゴ喋る感じがそっくりで、6600シリーズで音階がつけられるようになりましたがその後Beep音源の変調音声あたりまではこんないかにもな合成音声然とした音だった記憶があります。6001シリーズと同時期に学研の科学あたりで聖徳太子の声を専用のミニコンで合成したという付録がついてきたことがありますが、6001シリーズよりは自然ですが、男性がしゃべった声をエフェクトかけて電話品質くらいに落としたような声してました。
@aoao7aoao7
11 ай бұрын
PC6001にカセットポンした音声合成カートリッジで触りましたが、この系譜らしさがありましたね 語尾の伸ばし方が同じ感じ。小5の時に友人の高橋君宅で使わせてもらったから約40年前 以外に進歩していないのかな?って印象、8bit機には難しかったPCM録音も16bitだと比較的無難な 音質まで再生可能になり、短く録音した音声を切り貼りする手法が長く続いていましたね。
@donfonten
8 ай бұрын
ぱすぽ~とぉ~みせなぁ~さ~い(何のゲームか忘れましたが衝撃的でした)
@Mokkon
8 ай бұрын
NECはパソコンメーカーとして有名になりましたが、元々は電話交換機のメーカーなので色々と関係していたのかもしれません。
最初の合成音声でもこんなにはっきり聞き取れるのすごいな
これが初音ミクの先祖か
@TYHGWN3107
2 жыл бұрын
@@user-gm3sc7nk1n daisy bellな
@user-tq3jg4vu1y
Жыл бұрын
@@user-gm3sc7nk1n 必殺技っぽい
@__mero.
Жыл бұрын
@@user-gm3sc7nk1n クレイジーは草
この時代に合成音声をつくろうとした(しかも本当に作った)ことだけでなく それを使った言語学の研究まで考えていたことが古の知恵みたいですごい
結構とゃんとしてるのすごい
@user-yx9nl2yr9u
2 жыл бұрын
とゃんとしてるは草
@user-gc4sz5io6y
11 ай бұрын
その文章がちゃんとしてないんよ
@izu_39
11 ай бұрын
とゃんとしてるんですね
@AAAAA114
11 ай бұрын
とゃんとした文書こうよ
@_kurumi_chan__
11 ай бұрын
とゃんとしてない文
1899年生まれの人がまだ60歳、戦後14年、大正15年から33年だったと思うと、どれだけ昔なのかが実感できるな……
@shiramin
11 ай бұрын
アラフォーおっさん俺の親がまだ生まれてないし、もう死んでるジッジバッバが当時20代だったと思うとすごく昔の話だ
@blackbear6306
11 ай бұрын
東京タワー開業翌年だよ
@user-mn7mb7mx4l
9 ай бұрын
これめっちゃわかりやすい……@@blackbear6306
@user-mn7mb7mx4l
9 ай бұрын
すげぇ…………@@shiramin
隔世の感あります 『ワレワレ ハ ウチュウジンダ』 これ 初めて98買ったとき 出してみて 友人達に聞かせたら 「オモロイ」と 感心してた それから 三十年ほどした今 防災無線のデジタル化に伴い 合成音声化 村の老人曰く「どこの家の娘だろか 奇麗な声の標準語」とか
錆び付いた廃遊園地のまだ生きてる部分がたまたま作動したみたいな恐怖感ある
YMO的な『ザ・合成音声』って感じがたまらなくカッコイイですね✨✨
@genjai0806
11 ай бұрын
P-modelでは1992年の解凍P-MODELではAmigaのSay commandがサンプリングされてました
@lem6611
11 ай бұрын
そういえばYMOの頃にはもうパソコンに合成音声入ったりしてたけどYMOはそこまで合成音声使ってるわけでもなかったね
@user-mi1cf8fe1e
11 ай бұрын
@@lem6611YMOのは合成音声じゃなくてボコーダーだからね アレは機械を通してるだけで、発声そのものは人間のソレだよ
@user-hd2km9uh3h
11 ай бұрын
どちらかと言うとクラフトワークや冨田勲かと。
@user-TOKISUDENIOSUSHI
11 ай бұрын
ショウガクカン ビ デ オ
戦争終わって荒廃した日本が14年後に作ったんだぜ?凄いよねほんと当時の人は
@FunnyVideoTV100
Ай бұрын
本当のほんとにそうだね
「ええ」が「え、え」と単体で発音するのではなく「えー」というふうにつなげて発音してるのすごい
@usr747
11 ай бұрын
なんですごいのかわからん。
@potalo_dx3zt2wx7m
11 ай бұрын
@@usr747技術がすごいんやん
@usr747
11 ай бұрын
@@potalo_dx3zt2wx7m ええと発音させるのとえーと発音させることにどんな技術的な差があるの。
@usr747
11 ай бұрын
@user-pb3yb4pu7w 2 分前 @yotu1113 単に1文字ずつ発音させるんじゃなくて、前後の音に応じて最適な発音をさせてるのがすごいってことでは そんなことはしていないと思うけど。そもそも一文字という概念がないと思うが。一音ならまだわかるけど。
@user-sl1op3cp5v
11 ай бұрын
伸ばし棒ってコマンドがあったんかな え え or ええ ってので人間が表現してたんじゃないの
日本人はNoと言う事すら難しいのに「いやです」とはっきり言える合成音声さんすげえ
@ぱぴこぐみ
9 ай бұрын
???「まぁ、全部言わされてるんですけど」
@user-dl6yp3gg5l
8 ай бұрын
いやです、いゃです、いゃぇす、いえす!YES!
これを考えるとボイスボックスとかってもはや魔法だな
@user-gl7cs1rg2j
11 ай бұрын
十分に発達した科学技術は、魔法と見分けがつかないってか?
@whoooooontbehere
11 ай бұрын
@@user-gl7cs1rg2j正にそれ
このアナログ波形合成音を聞いた当時の技術者や数学者は、恐らく失禁するほどうれしかったと思う。
終戦からわずか14年 すごいよな
すばらしい。昭和30年代にここまで再現できるなんてすごすぎる。
「聞き取りテスト」の発音が英語のテストで聞く音程そのままでモヤァってした笑
この既視感あれだ、トモコレだ
初期の声を聞けば聞くほど某アーティストが出したCG年賀状に出てきた目玉みたいなやつの声に聞こえてくるし、この声が唄音ウタとか足立レイみたいな無機音源の遠い祖先と考えると熱いものがあるな…
東京タワーが完成前から合成音声ってあるんだ〜 何もない状態から作って現代に欠かせないや電話の機能やボーカロイドに発展したりする技術だったり先人の人たちってやっぱすごいな〜
ここから約20年後に、TIがスピーク・アンドスペルを売り出し、そこからさらに五六年で、パソコンゲームに正弦波音声合成を使った物が現れ、更に20年経つとボーカロイド…なんとも感慨深いですね。
@toyo-rex4899
11 ай бұрын
この合成音声から20年後といえば、YMOの「TECHNOPOLIS」内の「ト・キ・オ」や「T・E・C・H・N・O・P・O・L・I・S」という合成音声が出てきますね。 さらにその4年後にリリースされた同じYMOの「君に、胸キュン。」では、曲中の「キュン!」を合成音声で作成しようとしたけど、結局断念してメンバー3人の肉声を重ね合わせたものになっています。 40年ほど前まではそれほど合成音声を作成するのが難しいものだったのに、現在だとPC・スマホでチャチャッと作成できますから、この数十年の技術の進歩はすさまじいものです。
@GroupAdd01
11 ай бұрын
@@toyo-rex4899 テクノポリスのあの声、一度録音してボコーダーでエフェクトかけてたと思ってたんですが、実際には完全合成音声だったんですね。びっくり…。
@Kouta.K.
11 ай бұрын
そう?20年ってめちゃくちゃ長いよ 通信速度の進歩に比べたら大分遅いと思う
古典的なロボット系SFの金字塔である「われはロボット(邦題)」が出版されたのが1950年。 そのほか2001年宇宙の旅(の元ネタ)など、ロボットやAIが喋る、という超技術を描いた名作は50年代の物がわりとある。 SFで描かれるほど夢の技術だった「機械が喋る」という技術を、おなじ50年代に開発されてるってのが本当にすごい。
AI利用の音声変換について調べていたらこの動画がオススメに出てきました。技術の進歩ってすごいなあと感慨深いです。
黎明期の合成音声は、人工内耳でやるような感じで、機械で合成されたような音声になってしまいます。 人工内耳は、本来は3万本の聴覚神経をCochlearではわずか22個、Advanced Bionicsでは18本、 MED-ELでは12個の電極で肩代わりをしますので、機械で合成されたような聞こえ方になるそうです。
当時のおばあちゃんとかからの聴き取りの語音明瞭度もこのくらいだったから充分実用的に聞こえる。
何とも言えない不気味さがあって味があっていいなぁ
この動画の監修がその大昔の論文書いた人で最後ちょっと感動した
60年も前から機械に喋らせようとする考えがあったことに驚き
1959年って、キャリントン・イベントから、ちょうど一世紀後ですね。この時代に研究されていたとは、ビックリです。
調声してないUTAUみたいな声だけど楽器から作ってんのすごい努力
合成音声とは少々違うけどMPEGの圧縮率とかものすごいもんなぁ どちらもこういう解析の積み重ねから生まれたものなので兄弟みたいなものとも言えるか FHDや4Kの映像なんて圧縮伸張の仕組みが無かったらとても扱える代物じゃないし 人知れず基礎研究に取り組んだ先人達に感謝
@user-ou7se7dq4k
8 ай бұрын
基礎研究って大切なんですよね。
4:10の声が無駄にテンション高いおじさんみたいで好き😅
@Lilykatie0507
11 ай бұрын
テンションがHighですね。
泥ママに盗まれたPCにBEEP音で夜中にホラー音声流してみたって動画があったけど…夜中にこの絶妙にカスレた音声が流れてきたら確実に漏らす自信がある。 PC「…お、はよう。」
@azukidango
2 жыл бұрын
2チャンのやつやんw絶対見た後に調べたべw
@winpolluxfs9899
Жыл бұрын
@@azukidango だから何…?
1980年頃に松下電器(現Panasonic)が小型で「法定放送装置」と言うのが京阪バスや京都市営バスに取り付けられました。 「危険物を持ち込まないでください」「整理券をお取りください」「次停まります。ご乗車ありがとうございました」 バスで本格的に合成音声による案内放送はclarionで開発されたのが最初と言われています。
ボーカロイドの礎というか原点と考えるとすごい
@RapidTachikawa
11 ай бұрын
ボカロは完全機械ではなく中の人がいるのでちょっと違います 例えば初音ミクは藤田咲さんの声を元にして作られています ゆっくりは完全機械なのでこっちが近いですね
@ikalukakiyoe
11 ай бұрын
@@RapidTachikawa 中の人がいるから前者というわけでもないぞ。最近のAI系(Cevio AI、Synthesizer V AI、Voicepeak、VOCALOID6など)は中の人こそいるけど、後者の方が近い。
@user-hx1wf4lw4b
11 ай бұрын
@@ikalukakiyoe 詳しくないんですが、VOCALOIDは五十音すべて録音してるのではなく音声の要素を抽出して合成しているんでしたっけ? だとすると、「肉声から要素のみをデータ化して送信し、受信側は合成音声で復元・再生する」技術の発展形なんですね。 主要なアイデアは違っても技術は全部繋がってんだな…
@ikalukakiyoe
11 ай бұрын
@@user-hx1wf4lw4b 5までのVOCALOIDは音声を要素ごとに録音したものをつなぎ合わせることで歌声を生成してます。 五十音をどのレベルで録音しているのかは不明(小林幸子氏の話によると、「あい」発音した時の間の音声なんかも収録するとか)ですが、少なからず50音を録音する以上のデータを録音していることにはなります。(復元というよりは合成というほうが適当かも。) 因みに、VOCALOID6などのAI系音声は学習データを用意して、その学習結果から音声をPC内で0から生成するので、以前のものとは全然違います。(学習データを用意するだけなので、中の人は何曲か普通に歌うだけでよいのだとか。)
@user-xw1mo8zl4e
11 ай бұрын
どっちかというとゆっくりのご先祖様なのかな。 でもこの機械や技術が無ければ初音ミクちゃんは生まれなかったと思うと感動だよね!
なんかトモダチコレクション思い出したわ懐かしぃ〜
「ええ、そうです」が昔の人の言い方でおもしろい
これはすごい! チューニングは大変そうだけど、時間をかければ普通に会話できるレベルで驚いた。
2:30どうぶつの森のとたけけっぽい 今では歌えるにまで進化してるのが凄い
大変為になりました。先人達の努力には頭を垂れるのみです…
要するに、アナログシンセを調整しまくって 音声出したのか… これといいデイジーベルといい、あの時代に ボイロとかボカロじみたことやってるの 凄いよね
@ikalukakiyoe
11 ай бұрын
ボイロとかボカロは録音された音素の連続なのでどっちかというと方法1に近いぞ。(唯一足立レイだけが1と2の合わせ技って感じ。)
@user-denshikousaku_staygold
11 ай бұрын
@@ikalukakiyoe そっかあれ声サンプリングしてるんだっけか
@fukyouwa-yin
11 ай бұрын
@@ikalukakiyoe 足立レイは完全なる合成電子音だったと思う。人間の声は使ってないはず。
@femmefatale-dn7pe
11 ай бұрын
足立レイは木琴をベースに作った声だったはず
@ikalukakiyoe
11 ай бұрын
@@fukyouwa-yin中の人はいないよ、もちろん。ただ、歌を生成するときはUTAUを使用する。=録音したデータを物理的につなげる。なので、1と2の合わせ技といったまで。(今更だが、デフォ子も1と2の合わせ技か。灯台下暗しだった。) 余談ですが、Neutrino、Cevio AI、Synthesizer V AI、VoiSona 、Voicepeak、VOCALOID6、Ace Studioなどは中の人こそいるけど、AI生成(学習データに基づいて音声をPCで音声を作る=サンプリングではなくモデリング)なので、2の方になります。
当初、古いゲーム機種で サウンドの波形を入れる「容量」が限りなく少なかった時代 FINAL FANTASY シリーズで登場する、モーグリの「クポ」という音も もっとも容量が少ないサイン波を採用することで生まれました
@aoao7aoao7
11 ай бұрын
でもサイコソルジャーは唄っていた
今から約40年前、『燃えプロ』とか『水戸黄門』でファミコンが初めて喋った時は感動したものだった。
これが初音ミクのおじいちゃんだと思うと凄いな
4:24 目覚ましに使おうかなw
すごいP-MODEL感がある
@user-qv7ty1iw9v
11 ай бұрын
オゾノ・コブラノスキー
@genjai0806
9 ай бұрын
Amiga Say command
変なトーンってのには気になるけど、何を言ってるのかは理解できるから凄いですね!
この頃はまだ音声のスペクトラムを見て声の特徴を調べるってのはできなかったんやろな
だんだん話せるようになっていくみたいな感じがいい。
これも凄いですが冨田勲の無線等を使って山間部を走り電波の強弱やノイズを使って作ったという音声合成も凄い。昔の人は本当に奇知に飛んだ事をしてたんだなぁと改めて感心しました。
@miyotukushitv2475
6 ай бұрын
人力合成音声になるのかな?
あかりがやってきたぞ!って曲のあのセリフ達は相当すごいってことがよくわかった
趣味でいわゆるひとつの「プロ実況MAD動画」を作成しています。制作にあたり、この動画は極めて参考になりました。ならびに貴重でもあり非常にありがたい動画です。もっと早くこの動画に出会いたかったです。
この音声を使って人力ボーカロイドを作る猛者が出現すると予想
@aoitikuwa
11 ай бұрын
YAMAHA布教しようね
@genjai0806
9 ай бұрын
オゾノコブラノスキー
だんだん初代トモダチコレクションの音声に聞こえてくる
クラフトワークのようなかっこよさを感じた
トモコレってこれから作られてたのか...!!
「はいはい」の所が一部ゆっくりボイスっぽい
@SIGMA-M
Жыл бұрын
「研究」も
60年以上前からあったの凄い
モーニングコールで「オハ、ヨウ」とか言われたら恐怖で仕事休む
先人達の知恵が、今日の技術の基礎になり発展してると思うと考え深いですね。思った以上に、聴き取りやすく完成度が高い事に驚かされます。
開発者「シャベッタァァァァァァァ!!(歓喜)」
ここから60年足らずで日常の中に当たり前に合成音声が入ってきて意味のある使われ方をするようになった、ってのはすごいな 今はペッパー君みたいなのしかいなくても、あと50年もしたら表情豊かなロボットが日常生活の中でこちらによくできた皮肉を言ったりしてくるんだろうな
どうにか修復して「ゆっくりしていってね」と言わせたい
第一声目聞いたとき、ゾッとしたわ
最初は何でも難しいのよ。 無から有を作るわけだから。 発送、いや発想するだけでも凄いこと。 その時点で存在する技術をいろいろと組み合わせることで実現させる技術者には脱帽です。
研究目的が直接の合成音声ではなく音響心理学やG.7xx等のCODEC開発の基礎研究として生かされてたんですねぇ
CD💿の音も実際の楽器やボーカルの声ではなく、その楽器やボーカルの出す波形をデジタル処理して本物そっくりに再生しているのですね。しかし、人の耳には原音に忠実な音声として聞こえるから、不思議です。
人間の声真似をする鳥みたい
ソフト一つでできる時代からみると、PCが部屋一つだったのが、スマホというPC同様のが片手になったぐらいの違いがある。 時代の進歩はすげえ
母音の発声では「あ」と「お」を交互に発声しているように感じました。 「い」や「え」といった別の母音も発声していたのかもしれませんね。 ただ、「さ」や「ゆ」といった単語はしっかりと聞き取れましたし、ピッチやイントネーションの調整(現在で言うところの調声や調教)、それに1959年と言う時代も考えれば、その品質は素晴らしいと思いますね。 現在は「ソフトーク」や「VOICEROID」、「CeVIO」と言った高品質な音声合成システムが存在し、また販売されています。 その奥底には、この発声装置のデータが活かされているのでしょうね。
案内役は『モヤさま』w
ここから60年って考えると進化遅くないか 使う側の利便性がだいぶ変わったのかな
これのおかげで世界に誇る日本のボカロ文化があるとするとめちゃくちゃ感慨深いなぁ