Dzisiejszy tekst został napisany w stu procentach na klawiaturze. Ale wśród naszych ostatnich tekstów znajdziecie i takie, które powstały przy pomocy konwersji tekstu na mowę. Jeden z nas korzysta z tego sposobu od dawna, a drugi wypróbował go dopiero ostatnio. Czy się przekonał? A może okazało się, że lepsze jest wrogiem dobrego?
TTS, czyli Text to Speech
Jestem fanem pisania na klawiaturze. Właśnie w ten sposób, od kilkunastu lat, powstają wszystkie moje teksty. Co więcej, mam też swoje ulubione i niezastąpione narzędzie – klawiatury laptopów marki ThinkPad. Nawet do stacjonarnego komputera podłączoną mam thinkpadowską klawiaturę.
Tu z poczucia obowiązku chciałbym podkreślić wyższość thinkpadowskiego TrackPointa nad myszką, touchpadami i wszystkimi innymi sposobami obsługi kursora na laptopie. Miejsca by nie wystarczyło, aby opisać jak bardzo ten „dżojstik” ułatwia obsługę laptopa oraz jak skrajnie przydatny jest środowy przycisk służący do przewijania i nie tylko.
Każdy, kto dużo pisze wie, że dopasowana do potrzeb klawiatura to zbawienie. Jedni wybierają rozwiązania mechaniczne, a inni przyzwyczaili się do tak zwanego „małego skoku” klawiatur laptopowych. Mamy więc jakiś zbiór rozwiązań które są popularne i/lub mają grono zapalonych wyznawców. A skoro tak, to możemy podejrzewać, że są one lepsze niż gorsze. Przynajmniej dla niektórych zastosowań.
I tu dochodzimy do jednego z bohaterów dzisiejszego odcinka, czyli do TTS. Text to Speech, bo to o nim mowa, umożliwia przekształcanie mowy w słowo pisane. Nasz tekst „pisze się sam”, podczas gdy my tylko dyktujemy. Jasne, trzeba potem taki tekst zredagować, pousuwać zbędne wtrącenia, poprawić interpunkcję, ale to samo robimy dla dzieł powstających klasycznie.
Nic nie jest jednak bez wad. Tekst pisany przy pomocy rozpoznawania mowy ma zupełnie inny charakter, niż ten pisany na klawiaturze. Nie da się jednak ukryć, że bardzo szybko możemy przestawić się na ten sposób działania. Czego nie można powiedzieć o wspomnianym wcześniej TrackPoincie.
Krzywa uczenia się
Problem z TrackPointem idealnie wpisuje się w dzisiejszy motyw przewodni, który brzmi „lepsze jest wrogiem dobrego”. Cokolwiek nowego byśmy nie robili albo jakąkolwiek zmianę byśmy nie wprowadzali, możemy spodziewać się, że na początku będzie gorzej.
Tu oczywiście jest pewien wyjątek. Jeżeli wcześniej działaliśmy z gruntu źle albo w ogóle bez planu, niczym w „Metodyce YOLO„, to każda zmiana będzie zmianą na lepsze. Ale wśród czytelników naszego bloga raczej nie znajdzie się osób, które robiłyby wszystko totalnie źle. Wróćmy więc do tematu krzywej uczenia się.
Każda nowa technologia, koncepcja i rozwiązanie charakteryzuje się pewną krzywą uczenia się. Co więcej, jest ona różna dla różnych osób. To znaczy, że są rzeczy ogólnie łatwiejsze i trudniejsze, ale też wszyscy mamy jakieś predyspozycje i wcześniejsze doświadczenia. Osobie, która grała na gitarze będzie łatwiej nauczyć się „łoić na basie” niż perkusiście, który nigdy w struny nie brzdąkał. Natomiast ogólnie wyróżnimy też instrumenty łatwiejsze i trudniejsze.
Podobnie jest z naszym TrackPointem, który ma dość stromą krzywą uczenia się. Na początku „nic nam nie idzie” i bardzo łatwo jest zniechęcić się do tego urządzenia. Zupełnie odwrotnie jest z rozpoznawaniem mowy i „pisaniem” z wykorzystaniem TTS. Po prostu uruchamiamy odpowiednią funkcję i mówimy. Łatwiej więc jest się przekonać, czy to coś dla nas.
Ciągłe doskonalenie jako cel
Krzywa uczenia się, to powód dla którego nie powinniśmy traktować zmian bądź ciągłego rozwoju jako cel sam w sobie. W tekście pod tytułem „W pułapce Continuous Improvement” opisywałem sytuacje, w których firmy, organizacje i zespoły za nadrzędny cel stawiają sobie wzrost. Ale wiadomo, że nie da się rozsunąć ani przyspieszać w nieskończoność. Gdzieś w końcu nastąpi moment, w którym napotkamy na ograniczenia. Już to mówi nam, że stawianie sobie rozwoju jako głównego celu jest średnim pomysłem.
Pamiętajmy jednak, że rozwijać możemy się na wiele sposobów i „więcej, szybciej, lepiej” to ten jedyny. Być może chodzi nam o zwiększanie efektywności, robienie tyle samo i utrzymywanie stabilnego tempa, ale jednak mniejszym nakładem sił i środków? A może chcemy być nowocześniejsi i zastąpić przestarzałe technologie nowymi?
Podejście z szufladki „nic nie jest wystarczająco dobre” często kończy się rozczarowaniem i/lub zepsuciem tego, co dobre. Przed tym zresztą ostrzega podlinkowany powyżej tekst. Nie róbmy nic na siłę, poprawiajmy to, co poprawić jest sens.
Ale też – ryzykujmy i próbujmy nowych rzeczy. Paradoks? Skądże.
To jak to z jest z tymi „improvementami”?
Na fundamentalne pytania jest tylko jedna odpowiedź. „To zależy” nie bez powodu jest ulubioną odpowiedzią wszystkich konsultantów. Zacznijmy od podstaw – jeżeli jest bardzo źle, to kolejne zmiany zwykle nie zaszkodzą nam jeszcze bardziej, a mogą okazać się zbawienne. Jeżeli jest dobrze, to drobne zmiany i delikatna optymalizacja to jest dokładnie to, o co nam chodzi.
Najtrudniej jest nam w sytuacji, w której wszystko już zmierza w dobrą stronę, a jednocześnie widzimy wciąż obszary do poprawy. Z jednej strony możemy powiedzieć „lepsze jest wrogiem dobrego” i pozostać w tej nieszczęsnej „strefie komfortu”. Z drugiej – poprawiając cokolwiek musimy bardzo uważać, żeby nie zniszczyć tego, co już zbudowaliśmy.
Jeżeli miałbym do czegoś namawiać, to na pewno nie byłaby to optymalizacja za wszelką cenę. Z drugiej jednak strony wydaje mi się, że odpuszczamy wiele szans, bo jesteśmy przyzwyczajeni do starych rozwiązań i tego, co znane. Łukasz zachęca do „zwinnych eksperymentów„, a ja mówię – zaryzykuj. Spróbuj nowej technologii, nowego rozwiązania albo nowego podejścia. Ale zrób to z głową i pod paroma warunkami.
Rozsądne udoskonalanie
Dowiedz się, jaka jest krzywa uczenia się. Zastanów się, czy możecie poświęcić na to tyle sił i środków. Po drugie, sprawdź czy na pewno ta właśnie zmiana przyniesie najwięcej korzyści. Eksperymentowanie z nowym repozytorium kodu w sytuacji, w której mamy 30 błędów produkcyjnych dziennie jest średnim pomysłem. Po trzecie, podpatrz jak działają mistrzowie i osoby doświadczone. Jeżeli trudno nam jest znaleźć „wymiatacza” w danej dziedzinie, to jakie będą efekty początkujących?
Jeżeli chodzi o TrackPoint, to już dawno przestałem pokazywać korzyści płynące z tego rozwiązania. Jeśli ktoś nie ma możliwości spędzenia z nim więcej czasu, to się do niego po prostu nie przekona. Krzywa uczenia zniechęci osoby podchodzące do niego bez entuzjazmu czy wewnętrznej potrzeby. W tym przypadku faktycznie lepsze jest wrogiem dobrego.
A co w temacie Text To Speech? Byłem zdziwiony, jak szybko można wyprodukować surowy tekst, który potem równie szybko można przepisać na finalny artykuł. Spróbowałem TTS w sytuacji, w której miałem trochę wolnego czasu na świeżym powietrzu, a pod ręką jedynie telefon. I w takiej sytuacji te rozwiązanie pewnie się sprawdzi, ale na co dzień pozostanę przy moich ulubionych klawiaturach.
Idąc za swoimi radami przeprowadziłem ten eksperyment w „bezpieczny” sposób. Zaryzykowałem, w sytuacji w której nie miałem nic do stracenia. I tak też sugeruję próbować nowości, jeżeli wydawałoby się, że wszystko działa jak należy. Może będzie lepiej, może będzie to niewypał, ale nie przekonamy się zanim nie spróbujemy.
A mnie ciekawi, czy jesteście wskazać teksty z ostatniego miesiąca, które powstały właśnie z wykorzystaniem funkcji TTS. Dajcie znać w komentarzach!