普通は持ってて大型を、とか、四輪は持ってて二輪を、とか……(小声)

やはり闘争と繁殖が生物に定められた宿命やったんや……

まあ、最悪裏でバッチ処理で回して一番近いやつ数個のデータを作っておけばいい、という説はあるんですが。

ボトルネック方式はいろいろ突っ込みどころ(そもそもそれは座標と呼べるのか、座標が近いと曲が近いのは本当かなどなど)があるので別の方法を見つけたいんですよね……ただし計算量が高いのはNGで

コサイン類似度を効率的に検索できる構造とかあればご教授願いたいとは思ってます

現在の「座標」システムだとデータ構造としてR木が使えそうかなとは踏んでいます。実装は自分でしなきゃいけないっぽい雰囲気なのでちょっと二の足を踏んでますが……

ちなみに類似度の算出はMySQLにぶん投げています。8000曲に対して総当たりで0.11sec程度。

ダイナミクス変化の類似度を畳み込みニューラルネットワークで抽出している感じでしょうか。ただ、計算量は確かに問題になりそうなところです。今のところはサンプル曲数が8000と少ないのでなんとかなっていますが。

というかむしろあってくれ。完全に我流だと合ってるか検証するのがめんどい

Show thread

完全に我流で編み出したけど誰かすでにやっていそうな気はする

うたこさんの技術詳細です 

入力は数秒の音声データ(スペクトログラムなどの前処理はなし)、それに対して畳み込み4層、全結合を5+2層(後述)。教師データは「どの曲から切り出してきたデータか」。全結合層を5+2としたのはこの"+"の部分が8ニューロンと極端なボトルネックになっているため。この出力を「座標」とみなし、これのユークリッド距離で曲同士の「近さ」を算出します。

@decoybird スペクトログラムを与えるのも検討したんですが、今は本当に切り出しただけの波形データに畳み込みをしています。スペクトログラムですと次元ごとに処理が変わってくる関係で畳み込みにくいので……

@decoybird 波形をニューラルネットワークにぶちこんで「どの曲から切り出してきた音か」を判別するときの間違いを使ってます

曲調が似てるってなんだ……?(ゲシュタルト崩壊)

ほんとに似てる雰囲気の曲を再生できてるのか、自分の耳が信用出来ないので幅広い意見を聞きたい

ボカロ曲をおすすめしてくれるアレ、最近の曲を中心に再生するアプデ入れました。 utako-tune.jp/player を開くと設定ウィンドウが表示されると思うのでよしなにするとよしなにできます(語彙)

Show thread
Show older
Vocalodon

ボーカロイド好きが集うMastodonインスタンス、通称「ボカロ丼(ボカロドン)」です。 ** This server is for "Vocaloid" lovers. If you are not, please select other server. **

image/svg+xml