MacWhisper-ը անվճար տառադարձման ծրագիրն է, որին ես սպասում էի

Փնտրու՞մ եք Mac ծրագրակազմ՝ աուդիո ֆայլերը գրավոր տեքստային ֆայլերի արտագրելու համար: Կան բազմաթիվ վճարովի գործիքներ, ինչպիսիք են Otter.ai-ն և Trint-ը, որոնք կարող են իրական գումար արժենալ, երբ սկսեք դրանք չափազանց շատ օգտագործել: Բայց MacWhisper դա անվճար լուծումն է, որին սպասում էր ինտերնետը: Կամ, համենայն դեպս, այն, ում ես սպասում էի։

OpenAI-ը թողարկեց անհավանական հզոր անվճար ծրագիր դեռևս 2022 թվականի սեպտեմբերին, որը թույլ տվեց տեխնոլոգիական գիտելիքներ ունեցող մարդկանց իրենց աուդիո և վիդեո ֆայլերը վերածել անհավանական ճշգրիտ տառադարձումների: Խնդիրն այն էր, որ այն այնքան էլ մատչելի չէր սովորական օգտագործողի համար, քանի որ դուք պետք է ծանոթ լինեք Տերմինալ հավելվածում հրամանների օգտագործմանը:

Բայց MacWhisper-ի հետ, որն առաջին անգամ նկատեց 9to5MacԻնչ-որ մեկը վերջապես մշակել է GUI կամ գրաֆիկական ինտերֆեյս, որը հիմնված է OpenAI-ի Whisper-ի վրա և թողնում է շփոթեցնող տեխնոլոգիական իրերը գլխարկի տակ՝ թույլ տալով պարզապես քաշել և թողնել ձեր աուդիո ֆայլը և ստանալ տառադարձում շատ արագ: Եվ MacWhisper-ը չափազանց ճշգրիտ է, քանի որ OpenAI-ի Whisper-ը վերապատրաստվել է 680,000 ժամ աուդիո տվյալների համացանցում:

MacWhisper-ի լավ բաներից մեկն այն է, որ դուք չեք վերբեռնում աուդիո կամ վիդեո ֆայլը, որը ցանկանում եք արտագրել ինտերնետ: Դա կարևոր է լրագրողների համար, ովքեր կարող են աշխատել զգայուն պատմության վրա, կամ բոլոր նրանց համար, ովքեր ընդհանրապես զգուշանում են իրենց անձնական ֆայլերը ամպի մեջ վերբեռնելուց: Ֆայլը մնում է ձեր աշխատասեղանին, ինչը նշանակում է, որ ոչ մի հնարավորություն չկա, որ որևէ մեկը կարողանա գաղտնալսել ձեր ձայնը:

Կրկին, MacWhisper-ը պարզապես նոր ինտերֆեյս է անվճար ծրագրի համար, որը ներկայացվել է OpenAI-ի կողմից անցյալ տարվա վերջին, բայց այն իսկապես հեշտացնելու է աուդիո տառադարձումը գրեթե բոլորի համար: Քանի որ ես օգտագործում էի Whisper-ը և այն ահռելի օգտակար գտա այն թողարկվելուց հետո: Եվ նույնիսկ ես հիմա կօգտագործեմ MacWhsiper-ը, քանի որ այն, անշուշտ, արագացնելու է իմ աշխատանքի ընթացքը:

Որպես միայն մեկ օրինակ՝ FTX կրիպտո ընկերության փլուզման մասին լուրերից հետո ես օգտագործեցի Whisper-ը՝ վերծանել YouTube-ի տասնյակ ժամերի հին հարցազրույցները ընկերության հիմնադիր Սեմ Բենքմեն-Ֆրիդի հետ: Այնտեղից ես կարողացա փնտրել սղագրությունները և գտնել տարօրինակ և հետաքրքիր գաղափարներ հոդվածներ գրելու համար, ինչպես, երբ SBF-ն 2021 թվականի հունիսին ասաց, որ բլոկչեյնը կուղղեր Enron-ին. SBF-ի համեմատությունը Enron-ի հետ տարօրինակ պատահականություն էր՝ հաշվի առնելով այն ամենը, ինչ մենք հիմա գիտենք այն մասին, թե ինչպես է FTX-ը փլուզվել: Բայց ես երբեք չէի գտնի այդ պահը հին անհասկանալի հարցազրույցում, եթե չունենայի տասնյակ տեքստեր, որոնք ես կարող էի փնտրել: Եվ այդ գործընթացը, թեև ավելի հեշտ էր, քան ժամերով ու ժամերով ձայնագրություններ լսելը, այնուամենայնիվ կոպիտ էր և ոչ այնքան ավտոմատացված:

Whisper-ը իմ սարքում տեղադրվելուց հետո ես մուտքագրում էի «whisper audiofilename.mp3 —model tiny.en» Mac-ի Terminal հավելվածում ցանկացած անգամ, երբ ուզում էի ֆայլ արտագրել: WhisperMac-ի միջոցով ես պարզապես կարող եմ քաշել և թողնել իմ աուդիո ֆայլը, և այն իր կախարդանքն է անում առանց որևէ լրացուցիչ մուտքագրման:

Ես փորձարկեցի MacWhisper-ը NBC Nightly News-ի մի դրվագով, որը ներբեռնել եմ YouTube-ից: Եվ մի քանի սխալներից բացի, ինչպիսիք են «հողմնահեղուկ» բառը որպես «հողմափայլ» մեկնաբանելը և Լեսթեր Հոլտը որպես «Լեսթեր Հոլդ» լսելը, սղագրությունը շատ ճշգրիտ էր: MacWhisper-ն անվճար է, բայց կա ծրագրաշարի վճարովի մակարդակ, որը կարող է մի փոքր ավելի ճշգրիտ լինել, քանի որ այն օգտագործում է OpenAI-ի ավելի ինտենսիվ ուսուցման մոդելներ, բայց անվճար տարբերակը պարզապես հիանալի կաշխատի մարդկանց մեծամասնության համար:

MacWhisper-ը թույլ է տալիս արտահանել տառադարձված բառը մի քանի տարբեր ձևաչափերով, ներառյալ պարզ տեքստ, CSV կամ նույնիսկ ենթագրերի ֆայլի ձևաչափ, ինչպիսիք են SRT և VTT:

Եվ MacWhisper-ը միայն անգլերենի համար չէ: Դուք կարող եք ձայնագրել 100 տարբեր լեզուներով, ինչը աներևակայելի հարմար է: Միակ գործառույթը, որը չունի MacWhisper-ը, որի հետ ես հաճույք էի ստանում Whisper-ով Terminal հավելվածում խաղալուց, լեզվի թարգմանությունն է: Ես թարգմանել եմ վիրուսային տեսանյութեր ռուսերեն և չինարեն, և Twitter-ում այդ լեզուներով խոսող մարդիկ ինձ ասել են, որ թարգմանությունները ճշգրիտ.

Մյուս առանձնահատկությունը, որը չունի MacWhisper-ը, թեև այն հասանելի չէ նաև OpenAI-ի Whisper-ից, դա բարձրախոսների տարբերակման հնարավորությունն է: Օրինակ, եթե դուք արտագրում եք հարցազրույց երկու բանախոսների հետ, չկան հստակ գծանշումներ, որոնք ցույց են տալիս, երբ մի խոսնակը կանգ է առել, իսկ մյուսը սկսել է: Բայց ես կասկածում եմ, որ ինչ-որ մեկը ի վերջո կստեղծի այդ կարողությունը: Trint-ի նման վճարովի ծառայությունները դա անում են ավտոմատ կերպով, և շատ լավ կլիներ, որ ի վերջո անվճար լինի, բայց դուք ստանում եք այն, ինչի համար վճարում եք:

MacWhisper-ի հետ կա նաև մի գործառույթ, որտեղ դուք կարող եք ձեր համակարգչի խոսափողից խոսքը վերածել տեքստի, ինչը կարող է հարմար լինել, եթե ցանկանում եք ինչ-որ բան անմիջապես արտագրել:

Ես ամիսներ անցկացրեցի մտածելով, թե ե՞րբ ինչ-որ մեկը վերջապես կմշակի Whisper-ի համար GUI, քանի որ մի քանի հոգի ցուցադրեցին այն, բայց օգտագործողի համար հարմար բան չստեղծեցին: Բայց MacWhisper-ը, որը մշակվել է Jordi Bruin-ի կողմից, այն ծրագրաշարն է, որին ես սպասում էի: Bruin-ը նաև մշակել է այնպիսի ծրագրակազմ, ինչպիսին է MacGPT, որը թույլ է տալիս օգտատերերին մուտք գործել ChatGPT իրենց ընտրացանկից:

Դուք կարող եք ներբեռնել MacWhisper-ը անվճար, էլեկտրոնային փոստի գրանցմամբ, Bruin-ի կայքում:

Աղբյուր՝ https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/