Praktyka projektów usługowych dla nowych potrzeb językowych w erze sztucznej inteligencji i sztucznej inteligencji

Poniższa treść została przetłumaczona z języka chińskiego za pomocą tłumaczenia maszynowego, bez późniejszej edycji.

W niniejszym artykule przedstawimy dwa istotne przypadki projektów, aby zilustrować nowe potrzeby językowe klientów w erze sztucznej inteligencji oraz sposób, w jaki TalkingChina Translation opracowuje i dostarcza rozwiązania, które im odpowiadają. Wraz z nadejściem ery sztucznej inteligencji, coraz więcej potrzeb w zakresie usług językowych odchodzi od tradycyjnej formy, co stawia przed firmami tłumaczeniowymi wyższe wymagania: musimy być w stanie świadczyć usługi dostosowane do indywidualnych potrzeb, koncentrować się na potrzebach klienta, wykorzystywać nasze bogate globalne zasoby wielojęzycznych tłumaczy, możliwości dostarczania treści w wielu językach, komunikację z klientem i możliwości opracowywania spersonalizowanych rozwiązań, a także kompleksowe zarządzanie projektami jako kluczowe atuty konkurencyjne, aby sprostać zróżnicowanym, nowym potrzebom klientów w zakresie usług językowych w dobie globalizacji.

Przypadek 1

Tło projektu
Klient jest wiodącą firmą świadczącą usługi w zakresie technologii AI. Wykorzystując technologie takie jak modelowanie języka dużego (BML), przetwarzanie języka naturalnego (NLP), głębokie uczenie maszynowe, przetwarzanie prywatności i przetwarzanie w chmurze, świadczymy usługi w modelach Model as a Service (MaaS) i Business as a Service (BaaS). Nasze produkty i usługi znajdują zastosowanie głównie w różnych branżach, takich jak bankowość, dobra konsumpcyjne, ubezpieczenia, e-commerce, motoryzacja, logistyka, sprzedaż biletów, energetyka i budownictwo. Klient potrzebuje native speakerów wielu języków do nagrywania dźwięku w celu wyszkolenia inteligentnego robota głosowego, którego zadaniem będzie promowanie i zachęcanie do zakupu produktów finansowych banków, a także cyfryzacja sprzedaży i obsługi klienta. Klient ma nadzieję na zwiększenie zdolności interaktywnych robota dzięki tym rzeczywistym próbkom głosu, czyniąc go bardziej żywym i naturalnym w komunikacji z docelową grupą klientów.

Wymagania klienta

1. Do nagrania tego projektu potrzebni są trzej rodzimi użytkownicy języka angielskiego z różnymi akcentami z różnych regionów (angielski londyński, angielski amerykański z akcentem północno-waszyngtońskim, angielski singapurski), a także rodzimi użytkownicy języka hiszpańskiego z Meksyku.

2. Uczestnicy będą nagrywać na podstawie tekstu dostarczonego przez klienta, a urządzeniem nagrywającym może być telefon komórkowy. Uczestnicy nie muszą posiadać profesjonalnego doświadczenia dubbingowego. Jednak ze względu na stosunkowo pisemny charakter dostarczonego tekstu, klient ma nadzieję, że aktorzy głosowi będą w stanie reagować elastycznie i przekształcać treść pisemną w bardziej potoczną i emocjonalnie adekwatną ekspresję, opartą na charakterystyce poszczególnych ról.


3. Projekt obejmuje głównie dwa aspekty wymagań dotyczących usług językowych:

3.1 Przegląd nagranego tekstu. Konieczne jest wprowadzenie modyfikacji językowych w tekście i dostosowanie go do ustnej ekspresji nagrań;
3.2 Nagrywaj zgodnie z wymaganiami sceny. Nagranie będzie obejmować dwie postacie: postać AI i postać użytkownika.

Trudności w projekcie

1. Trudności w znalezieniu zasobów: Ograniczenia regionalne są bardzo rygorystyczne i wymagają nie tylko zapewnienia zrównoważonej proporcji płci wśród aktorów głosowych, ale także zapewnienia, że ​​ich głosy i emocje głosowe spełniają szczególne wymagania klientów;


2. Wysokie wymagania dotyczące kompetencji firm tłumaczeniowych w zakresie zarządzania projektami: Ponieważ jest to niekonwencjonalny projekt tłumaczeniowy, niektórym zasobom brakuje odpowiedniego doświadczenia zawodowego. W związku z tym personel zarządzający projektem musi opracować odpowiednie wytyczne i zasoby szkoleniowe w oparciu o wymagania i opinie klientów, aby ułatwić szkolenia i pomóc większej liczbie zasobów w doskonaleniu zdolności realizacji projektów, rozszerzeniu zakresu zasobów i zmniejszeniu zależności od niektórych dojrzałych zasobów.


3. Metoda wyceny opiera się na stawkach godzinowych, a klient przedstawi przybliżony zakres godzin pracy, który jest akceptowalny w rozsądnym zakresie. Jednakże cena jednostkowa jest niska, dlatego firma tłumaczeniowa może jedynie dołożyć wszelkich starań w ramach „niemożliwego trójkąta” zarządzania projektem, czyli ceny, jakości i czasu.

Plan odpowiedzi na problemy z tłumaczeniami TalkingChina

Jak stawić czoła wyzwaniom związanym z zasobami:


Mając na uwadze skuteczność późniejszego nagrania, przyjęliśmy podejście, w którym ta sama osoba odpowiada zarówno za przegląd tekstu, jak i za nagranie. Wybór ten nie tylko pomaga zwiększyć dokładność korekty, ale także stanowi solidny fundament pod późniejsze efekty nagrania.

W odpowiedzi na wymagania projektu aktywnie poszukujemy rodzimych użytkowników języka lokalnego, posiadających doświadczenie w pracy w call center i telemarketingu w określonych regionach, za pośrednictwem oprogramowania mediów społecznościowych.

1. W procesie selekcji zasobów wymagamy od klienta dostarczenia przykładowego tekstu, który możemy przesłać zainteresowanym osobom do testów audio. Jednocześnie przeprowadziliśmy spotkania online z klientami, aby szczegółowo omówić szczegóły, takie jak ton głosu i intonacja, co pozwoliło nam dokładnie zrozumieć ich potrzeby i oczekiwania. Po wstępnej selekcji rekomendujemy naszym klientom doskonałe próbki audio. Po potwierdzeniu przez klienta, przystąpimy do korekty nagranego tekstu.


2. Wykonanie korekty tekstu audio: Ponieważ teksty audio są prezentowane w formie konwersacyjnej, kładziemy nacisk na użycie zwrotów potocznych podczas korekty, unikając skomplikowanych, długich zdań, a priorytetowo traktując zdania krótkie i jasne, aby lepiej przekazać informacje. Ponadto, używany język powinien być jak najbardziej zbliżony do najczęściej używanych zwrotów przez miejscową ludność, co nie tylko wzmacnia pokrewieństwo tekstu, ale także zapewnia zrozumienie dla odbiorców. Dbając o potoczność, będziemy również ściśle kontrolować, aby oryginalne znaczenie zdania nie uległo zmianie.


3. Wykonanie nagrania: Pomagamy uczestnikom nagrywać w żywy i porywający sposób, unikając bezmyślnego uczenia się na pamięć i tworząc autentyczną atmosferę dialogu. Podczas nagrywania efekty dźwiękowe w tle muszą być spójne, aby zapewnić ogólną spójność. W nagraniu występują dwie role: rola sztucznej inteligencji (AI) i rola użytkownika (User). Pomagamy uczestnikom projektu wykazać się naturalnymi, entuzjastycznymi, przyjaznymi i przekonującymi cechami podczas nagrywania postaci sztucznej inteligencji (AI), podczas gdy postać użytkownika powinna być jak najbardziej zbliżona do codziennej sytuacji odbierania telefonów. Ogólny ton nie powinien być zbyt prosty ani dostojny, a personel nagrywający może wyobrazić sobie siebie odbierającego telefon marketingowy, co zapewnia swobodną interakcję – im bardziej naturalnie, tym lepiej. Należy pamiętać, że finalnego tekstu nie można modyfikować podczas nagrywania, ale słowa kluczowe, takie jak „OK”, „Eee”, „Jasne”, „Wow”, można swobodnie dodawać, aby wzmocnić wrażenie ożywienia.


4. Ciągłe szkolenie personelu realizującego nagrania: Przed oficjalnym rozpoczęciem nagrywania przeprowadziliśmy odpowiednią komunikację i szkolenia online dla uczestników, aby upewnić się, że opanują ton i stan nagrania. Po zakończeniu nagrania pierwszego projektu, będziemy kontynuować komunikację i szkolenie personelu realizującego nagrania w oparciu o opinie klientów. Proces ten ma na celu pomóc im szybko znaleźć stan tonu nagrania, który spełnia wymagania, co pozwoli lepiej symulować rzeczywiste sceny rozmów. Wszystkie materiały szkoleniowe i pomocnicze gromadzą się w zasobach wiedzy projektu, tworząc kompletny zestaw próbek audio i pisemnych, ustandaryzowanych wymagań.


5. Wykonaj odpowiednią ilość prac ostrzegawczych:

Po pierwsze, podpisaliśmy z każdym uczestnikiem umowę, w której zrzekaliśmy się praw własności intelektualnej do jego głosu, a także jasno uzgodniliśmy z klientem cel nagrania głosu, aby uniknąć potencjalnych sporów w przyszłości.
Po drugie, subtelne różnice w tonie, ekspresji emocjonalnej i innych aspektach mowy mogą skutkować koniecznością pewnych przeróbek. Dlatego przed rozpoczęciem projektu musimy osiągnąć porozumienie ze wszystkimi uczestnikami projektu i klientami, aby wyjaśnić, w jakich okolicznościach ponowne nagranie może być wykonane bezpłatnie, a w jakich przypadkach naliczane będą dodatkowe opłaty. To jasne porozumienie nie tylko pomaga kontrolować koszty projektu, ale także zapewnia jego uporządkowany przebieg, zgodnie z ustalonym harmonogramem i standardami jakości, unikając sporów.

Przypadek 2
Tło projektu
Klient to firma technologiczna, która koncentruje się na innowacjach w dziedzinie inteligentnych pojazdów, specjalizująca się w nowych źródłach energii, inteligentnym kokpicie i inteligentnym podwoziu, znacząco zwiększając możliwości tradycyjnych pojazdów w zakresie inteligentnych ulepszeń. Aby poprawić wydajność samochodowego systemu głosowego, klient przedstawił szereg wymagań, w tym rozszerzenie instrukcji, wielojęzyczność oraz nagrywanie instrukcji dla rodzimych użytkowników. Gromadząc te autentyczne próbki głosu, klienci mają nadzieję na zwiększenie interaktywności systemu głosowego, umożliwiając mu precyzyjne i skuteczne rozpoznawanie poleceń głosowych użytkownika.

Wymagania klienta


1. Rozszerzenie i wielojęzyczność instrukcji

Klient udostępnił wszystkie funkcje języka chińskiego w swoim samochodowym systemie głosowym. Dla każdej funkcji języka chińskiego rozszerzymy co najmniej 20 powiązanych poleceń głosowych, w zależności od jej przeznaczenia. Instrukcje te muszą być zgodne z codziennymi scenariuszami użytkowania i sformułowane w sposób potoczny, aby zapewnić użytkownikom łatwą i naturalną interakcję z systemem w przyszłości.

Na przykład:

Funkcja podstawowa: Moduł klimatyzacji
Funkcja dodatkowa: Włączanie klimatyzacji
Zgodnie z funkcją drugorzędną konieczne jest rozszerzenie co najmniej 20 instrukcji
Języki: angielski, rosyjski, arabski.

Wymagania dotyczące nagrywania w języku ojczystym

Osoby mówiące po rosyjsku i arabsku ze Zjednoczonych Emiratów Arabskich muszą dokonać osobnych nagrań zgodnie z wcześniejszymi wielojęzycznymi instrukcjami. Podczas nagrywania należy mówić naturalnie i płynnie po angielsku i rosyjsku, a także po angielsku i arabsku.
Klient musi nagrać dźwięk w języku angielskim i rosyjskim, a także angielskim i arabskim, zgodnie z podanym tekstem, w wyznaczonych miejscach w Wuhan i Szanghaju. Do nagrania każdego języka potrzeba 10 rejestratorów (5 mężczyzn i 5 kobiet), a sceny obejmują biuro klienta i prawdziwy samochód na drodze. Materiał audio musi być dokładny, kompletny i płynny.

Trudności w projekcie

Ograniczony budżet;
Firmy tłumaczeniowe stawiają wysokie wymagania w zakresie umiejętności zarządzania projektami: rozszerzanie i wielojęzyczność instrukcji to projekty nietypowe, wymagające od personelu zarządzającego projektami opracowania odpowiednich wytycznych i zasobów szkoleniowych w oparciu o konkretne wymagania i opinie klientów;
Niedobór zasobów: Klient życzy sobie, aby nagrania w języku arabskim były wykonywane przez native speakerów ze Zjednoczonych Emiratów Arabskich i nagrywane na miejscu, w wyznaczonym mieście, z uwzględnieniem proporcji płci wśród osób nagrywających. Osoby native speakerzy języka arabskiego z innych krajów nie są akceptowane.

Plan odpowiedzi na problemy z tłumaczeniami TalkingChina


Jak radzić sobie z wyzwaniami związanymi z brakiem zasobów:


1.1 Biorąc pod uwagę specyfikę projektu, w pierwszej kolejności zdecydowaliśmy się na dokończenie rozszerzenia instrukcji o język angielski. W bogatej bibliotece zasobów TalkingChina poszukiwaliśmy native speakerów języka angielskiego, którzy cechowali się wysoką współpracą, szybką informacją zwrotną i dogłębnym zrozumieniem wymagań projektu. Priorytetem było rozszerzenie 20 instrukcji i przesłanie ich klientowi do zatwierdzenia. Na podstawie opinii klientów stale aktualizujemy wytyczne i zapewniamy bieżące szkolenia. W trakcie procesu rozszerzania instrukcji stale utrzymujemy bliską współpracę z klientami i szybko odpowiadamy na pytania dotyczące aspektów funkcjonalnych, aby lepiej zrozumieć ich potrzeby. Język angielski posłuży nam jako szablon do rozszerzenia instrukcji w języku rosyjskim i arabskim. Ta strategia nie tylko poprawia wydajność pracy i zmniejsza liczbę poprawek, ale także stanowi solidny fundament pod późniejsze efekty nagrywania.


1.2 W odpowiedzi na wymagania projektu nagraniowego, rozpoczęliśmy poszukiwania native speakerów w Wuhanie, Szanghaju i okolicach. W rezultacie szybko pojawiły się rosyjskie zasoby w języku ojczystym, ale krajowe zasoby dla języka arabskiego były bardzo ograniczone, a koszty generalnie przekraczały budżet klienta. W tej sytuacji wielokrotnie kontaktowaliśmy się z klientem w sprawie jego zapotrzebowania na nagrania w języku arabskim i ostatecznie wypracowaliśmy rozwiązanie kompromisowe: wprowadziliśmy zdalne nagrywanie przez Emiraty Arabskie podczas statycznego nagrywania w biurze. Podczas dynamicznego nagrywania pojazdu na drodze, do projektu zaproszono kilku native speakerów arabskich z regionów spoza ZEA.


2. Realizacja nagrań: Podczas nagrywania offline, dla każdego native speakera uczestniczącego w nagraniu, przygotowaliśmy szczegółowy przewodnik dotyczący wymagań nagrywania w języku angielskim oraz szczegółowy harmonogram oparty na czasie klienta i uczestników. W przypadku nagrań zdalnych, zapewniamy również każdemu uczestnikowi projektu wskazówki dotyczące nagrywania w języku angielskim i organizujemy pracę zgodnie z potrzebami klienta. Uczestnicy są zobowiązani do nagrywania za pomocą komputera lub telefonu komórkowego w cichym otoczeniu, zachowując odległość od 20 do 40 centymetrów od urządzenia, aby symulować interakcję między samochodem a systemem pokładowym, oraz do prowadzenia rozmów przy normalnej głośności. Przed rozpoczęciem oficjalnego nagrania wymagamy od każdego uczestnika nagrania próbki dźwięku i oczekiwania na potwierdzenie klienta przed rozpoczęciem oficjalnego nagrania.


Podsumowanie projektu i perspektywa


Wraz z dynamicznym rozwojem technologii sztucznej inteligencji (AI), branża usług językowych przechodzi bezprecedensowe zmiany. Ciągłe pojawianie się nowych wymagań w zakresie usług językowych stawia nowe wyzwania przed modelami usług i możliwościami firm tłumaczeniowych. Oto podsumowanie tych dwóch przypadków i kilka refleksji na temat przyszłości:


1. Innowacyjne modele usług: Tradycyjne usługi językowe nie są już w stanie sprostać obecnemu zapotrzebowaniu rynku, a innowacyjne modele usług, takie jak Model as a Service (MaaS) i Business as a Service (BaaS), stają się nowymi standardami branżowymi. Firma tłumaczeniowa TalkingChina pokazała, jak elastycznie dostosowywać się i przewodzić tej zmianie na przykładzie tych dwóch przypadków.


2. Połączenie technologii i nauk humanistycznych: W erze sztucznej inteligencji postęp technologiczny łączy się z subtelnymi emocjami i kulturowym kontekstem języka ludzkiego, aby zapewnić klientom bardziej spersonalizowane i naturalne doświadczenie obsługi. Nasze doświadczenie projektowe pokazało, że dzięki dogłębnemu zrozumieniu potrzeb klientów i różnic kulturowych możemy tworzyć atrakcyjniejsze produkty usług językowych.


3. Nowe wyzwania w zarządzaniu projektami: Zarządzanie projektami nie polega już tylko na zarządzaniu procesami i czasem, ale bardziej na zarządzaniu talentami, technologią i innowacyjnym myśleniem. Firma tłumaczeniowa TalkingChina pokazała na przykładzie tych dwóch przypadków, jak pokonać ograniczenia budżetowe i zasobowe dzięki udoskonalonemu zarządzaniu i innowacyjnemu myśleniu.


4. Globalna integracja zasobów: W kontekście globalizacji, popyt na usługi językowe wykracza poza granice państwowe, co wymaga od firm tłumaczeniowych zdolności do integracji zasobów globalnych. Nasz przykład pokazuje, jak znaleźć i wykorzystać najodpowiedniejsze zasoby za pośrednictwem globalnej sieci, aby sprostać specyficznym potrzebom klientów.


5. Ochrona własności intelektualnej: Świadcząc usługi językowe, musimy również przywiązywać wagę do ochrony praw własności intelektualnej. Podpisując z uczestnikami umowy precyzujące zakres i cel wykorzystania materiałów głosowych, możemy zapobiec potencjalnym zagrożeniom prawnym.


6. Ciągła nauka i adaptacja: Wraz z dynamicznym rozwojem technologii sztucznej inteligencji (AI), firmy tłumaczeniowe muszą nieustannie poznawać najnowsze technologie i trendy branżowe, aby dostosowywać się do stale zmieniającego się otoczenia rynkowego. Nasze doświadczenie projektowe pozwoliło nam zgromadzić cenne zasoby wiedzy, tworząc solidny fundament pod przyszły rozwój.

Oba te przypadki przyniosły jak dotąd dobre rezultaty. Nie tylko zapewniamy naszym klientom wysokiej jakości usługi językowe, ale także wyznaczamy nowe standardy w branży. W przyszłości TalkingChina Translation Company będzie nadal poszukiwać i wprowadzać innowacje, aby sprostać stale zmieniającym się potrzebom w zakresie usług językowych w erze sztucznej inteligencji.


Czas publikacji: 09-06-2025