MacWhisper е бесплатниот софтвер за транскрипција што го чекав

Дали барате софтвер за Mac за транскрипција на аудио датотеки во пишани текстуални датотеки? Има многу платени алатки, како Otter.ai и Trint, кои можат да чинат вистински пари кога ќе почнете да ги користите премногу. Но MacWhisper е бесплатното решение кое го чекаше интернетот. Или, барем, оној што го чекав.

OpenAI објави неверојатно моќна бесплатна програма уште во септември 2022 година, која им овозможи на луѓето со малку технолошки такт да ги претворат своите аудио и видео датотеки во неверојатно точни транскрипти. Проблемот беше што не беше многу достапен за просечниот корисник, бидејќи требаше да се запознаете со користење на команди во апликацијата Терминал.

Но, со MacWhisper, кој прв го забележал 9to5Mac, некој конечно разви GUI, или графички кориснички интерфејс, кој се надоврзува на Whisper на OpenAI и ги остава сите збунувачки технолошки работи под капакот, дозволувајќи ви само да ја влечете и испуштите вашата аудио датотека и да добиете транскрипција многу брзо. А MacWhisper е исклучително прецизен затоа што Whisper на OpenAI е обучен 680,000 часа на аудио податоци на веб.

Една од убавите работи за MacWhisper е тоа што не ја прикачувате аудио или видео датотеката што сакате да се препише на Интернет. Тоа е важно за новинарите кои можеби работат на чувствителна приказна или за секој кој обично е претпазлив да ги прикачува своите лични датотеки на облакот. Датотеката останува на вашиот десктоп, што значи дека нема шанси некој да го пресретне вашето аудио.

Повторно, MacWhisper е само нов кориснички интерфејс за бесплатна програма што беше воведена од OpenAI кон крајот на минатата година, но навистина ќе ја олесни транскрипцијата на аудио за речиси секого. Затоа што го користев Whisper и го сметав за исклучително корисен откако беше објавен. Па дури и јас сега ќе користам MacWhsiper, бидејќи тоа сигурно ќе го забрза мојот работен тек.

Како само еден пример, по веста за колапсот на крипто компанијата FTX, користев Whisper за да препишам десетици часа стари интервјуа на YouTube со основачот на компанијата Сем Банкмен-Фрид. Оттаму, можев да ги пребарувам транскриптите и да најдам чудни и интересни идеи за пишување написи, како кога СБФ рече во јуни 2021 година дека блокчејн би го поправил Енрон. Споредбата на SBF со Енрон беше чудна случајност, со оглед на сè што сега знаеме за тоа како пропадна FTX. Но, никогаш не би го пронашол тој момент во едно старо нејасно интервју без да имам десетици транскрипти што би можел да ги барам. И тој процес, иако беше полесен од слушањето касети со часови и часови, сепак беше незгоден и не многу автоматизиран.

Откако го инсталирав Whisper на мојот уред, пишував „whisper audiofilename.mp3 —model tiny.en“ во апликацијата Terminal на Mac секогаш кога сакав да препишувам датотека. Со WhisperMac, можам само да ја влечам и испуштам мојата аудио датотека и таа ја прави својата магија без дополнително пишување.

Го тестирав MacWhisper со епизода од NBC Nightly News што ја преземав од YouTube. И настрана од неколку грешки, како што се толкувањето на зборот „windchills“ како „windhills“ и слушањето на Лестер Холт како „Lester Hold“, транскриптот беше многу точен. MacWhisper е бесплатен, но има платено ниво на софтвер кој може да биде малку попрецизен бидејќи користи поинтензивни модели за обука на OpenAI, но бесплатната верзија ќе работи одлично за повеќето луѓе.

MacWhisper ви овозможува да го извезете препишаниот збор во неколку различни формати, вклучувајќи обичен текст, CSV или дури и формат на датотека со преводи како SRT и VTT.

И MacWhisper не е само за англиски јазик. Можете да препишете аудио на 100 различни јазици, што е неверојатно корисно. Единствената карактеристика што ја нема MacWhisper, со која уживав додека си играв на Whisper во апликацијата Terminal, е преводот на јазици. Преведував вирални видеа на руски и кинески и луѓе кои ги зборуваат јазиците на Твитер ми кажаа дека преводите се точни.

Другата карактеристика што ја нема MacWhisper, иако исто така не е достапна од OpenAI's Whisper, е способноста да се разликуваат звучниците. На пример, ако препишувате интервју со двајца звучници, нема јасни ознаки што покажуваат кога еден звучник престанал, а друг започнал. Но, се сомневам дека некој ќе ја изгради таа способност на крајот. Платените услуги како Тринт го прават тоа автоматски, и би било одлично да го имате бесплатно на крајот, но вие го добивате она за што плаќате.

Има и функција со MacWhisper каде што можете да го конвертирате говорот од микрофонот на вашиот компјутер во текст, што може да биде корисно ако сакате да препишете нешто веднаш.

Поминав месеци прашувајќи се кога некој конечно ќе развие GUI за Whisper, бидејќи неколку луѓе го снимија, но не создадоа ништо многу погодно за корисниците. Но, MacWhisper, кој беше развиен од Џорди Бруин, е софтверот што го чекав. Бруин има развиено и софтвер како MacGPT, што им овозможува на корисниците пристап до ChatGPT од нивната лента со мени.

Можете да преземете MacWhisper бесплатно, со регистрација на е-пошта, на веб-страницата на Бруин.

Извор: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/