Gondolatból jegyzetelő gép

Valamikor borzasztó régen, amikor még kerékpárral jártam dolgozni – atyavilág, azok a békebeli munkahelyi évek – szóval valamikor piszok régen ábrándozgattam arról, hogy jaj de jó lenne valami olyan ketyere, amely venné a gondolathullámaimat és szöveggé konvertálná, méghozzá írásban, txt formátumban. Hiszen a legjobb gondolataim bringázás közben keletkeztek, viszont mire hazaértem és lezuhanyoztam, az egész eltűnt a devnullban..

Ez úgy merült fel ismét, hogy gőzerővel tervezem a nyári programokat és nagyon úgy néz ki, hogy ha most aprólékosan megtervezek mindent, akkor ugyan bele fog férni a nyárba a tömérdek túra és a munkavégzés is, egyvalami nem fog beleférni, az, hogy ezeket az élményeimet megírjam. Elméletileg működhetne, hogy a sátorban a lefekvés előtti órákban bepötyögöm mobiltelefonba az aznapi feljegyzéseket, de a gyakorlat azt mutatja, hogy ez kifejezetten kényelmetlen, fárasztó és nehézkes. A tavalyi túrákon már teljesen elhagytam, írtam otthon fejből azt, amire emlékeztem. Persze tavaly még volt időm.

A reménytelenség biztos tudatával azért rákerestem a guglin… és megvan. Emberek. Megvan a fejemből jegyzetelő gép. Várni kellett rá 15-18 évet, de itt van, leteszteltem, működik.

1. Venni kell egy kémmikrofont. Ez vízálló, nyakba akasztható, mindig kéznél van. Bekapcsolom, indítja a felvételt, kikapcsolom, leállítja. Otthon usb kábellel csatlakoztatom a számítógéphez, a wav fájlokat felmásolom.

2. A számítógépbe kell hangszóró és mikrofon. Ez a mai laptopos/homeoffice világban szerintem mindenkinél adott.

3. Google Translate. Beállítom, hogy fordítson magyarról urdura.

4. Megnyomom a bal alsó sarokban lévő mikrofon ikont, majd lejátszom a wav fájlt. A magyar szöveg megjelenik a bal oldali ablakban. Ki lehet másolni egy txt fájlba.

Tadamm.

A 2. lépés megkerülhető, Enterprise Windows 10 esetén a Chrome böngészőben be lehet állítani, hogy a hangot ne mikrofonról, hanem a belső keverőpultról vegye, ekkor ki tudjuk szűrni a külső zajokat.

Linkek
A fenti módszer leírása.
Alrite (online, fizetős).
Transcriptor (online, fizetős).

A következő lépés az lesz, hogy a blogbejegyzéseket megíratom a ChatGPT-vel.

5 Comments

  1. Tavaly botlottam bele hasonlo esetbe…
    Siket ismerosnek raktam ossze egy youtube feliratozot. A fizetos opciok kiestek a szankciok miatt.

    Round 1.
    YT fut fel kepernyon, masik felen G translate audio routolva a mikrofonba Voicemeeter-rel.
    -max 10-15 perc mukodes, altalaban rovidebb
    -barmit csinaltam a gepen, ha translate elvesztette a fokuszt megallt…
    Round 2.
    https://www.speechtexter.com/ , szinten G S2T api.
    -out of focus mukodik
    -teszteltem egy oras videoval, no problem
    -szerencsetlen kollega szemei maratont futottak a video es a szoveg kozott… lehetne ennel jobb, talan a sajat gepen is tudna hasznalni…
    Round 3.
    Egy ocso’ linux vps leporol.
    . web formon user postolja a youtub linket
    .. yt-dlp letolti az audiotracket a videorol
    … autosub megcsinalja a feliratot
    …. visszaadja a videot egy iframe-ben, rahuzva az .srt feliratot
    Python webserver, cron job figyel a taskokra, email kuld ha kesz a felirat… igazi sufnituning :)
    -meg mindig csak egy blob of text barmifele irasjelek nelkul

  2. Tul hosszu a kommentem, vagy tul sok link, v vmi hasonlo…
    Itt olvashato: https://pastebin.com/tu9hBm5n

  3. Idokozben fejlodott a tortenet… Loptam egy scriptet amivel lehet hasznalni az openai whispert ingyen google colab-on. Kicsit le van butitva, youtube linkbol general egy magyar srt filet. Csak egy browser es egy G account kell hozza.
    https://colab.research.google.com/drive/1VS5Rh0gHlzNGSwN2GZ3Sk4Msmc5ITHxl?usp=sharing
    A 2023.03 biatorbagy korhoz 17 perc alatt dobta ki ezt a feliratot: https://pastebin.com/75eTMtaP

    Ahonnan lopva lett: https://colab.research.google.com/github/ArthurFDLR/whisper-youtube/blob/main/whisper_youtube.ipynb

Leave a Reply

Your email address will not be published. Required fields are marked *