Jak zauważył Michael Curtis, od strony językowej badanie fonetyki polega na tym, jakie dźwięki mowy wydają ludzie i jak je wytwarzają. Fonetyka nie podchodzi do rzeczy z muzycznego punktu widzenia, więc pomyślałem, że może spróbuję dokonać pewnych korelacji między fonetyką a akustyką muzyczną.
Fonetyka dzieli dźwięki mowy (fonemy) na dwie szerokie kategorie: samogłoski i spółgłoski . Linie mogą być tam nieco rozmyte, ale samogłoski zawsze dotyczą strun głosowych i zwykle są wydawane z mniej lub bardziej otwartymi ustami, podczas gdy spółgłoski obejmują określone ruchy zębów, warg i języka i mogą, ale nie muszą, używać strun głosowych .
W przypadku samogłosek zawsze używamy naszych strun głosowych, co oznacza, że samogłoski zawsze mają jakąś wysokość . Dźwięki używane podczas mowy generalnie nie mają typowego związku muzycznego, ale czasami mogą być „przypadkowo” muzyczne. Na przykład, kiedy dziecko drwi na placu zabaw w stylu „Johnny is a chick-en!”, Często śpiewają melodyjną tercję. Ale to przypadek.
Sposób, w jaki wydajemy różne dźwięki samogłosek, polega na zmianie kształtu naszych ust, a to zmienia barwę dźwięku wytwarzanego przez nasze struny głosowe. Innym muzycznym sposobem spojrzenia na to jest to, że filtrujemy (tak jak w przypadku korektora lub filtra syntezatora) wysokość dźwięku, która jest tworzona przez nasze struny głosowe.
To całkowicie obejmuje muzyczne aspekty dźwięków samogłosek. Moglibyśmy mówić o głośności i czasie trwania (dwóch innych głównych wymiarach muzyki), ale żaden z nich nie zmienia dźwięku samogłosek, który wydajemy lub słyszymy.
Spółgłoski są bardziej skomplikowane. Podzielmy je na kategorie fonetyczne dźwięczne (używając strun głosowych) i bezdźwięczne (nie używając strun głosowych).
Spółgłoski bezdźwięczne (takie jak / t /, / p /, / f /, / k /, / s /) z muzycznego punktu widzenia są najbliższe dźwiękom perkusji. To są rodzaje dźwięków, które wydajemy, gdy bijemy z pudełka. Dźwięki perkusyjne i bezdźwięczne spółgłoski są muzycznie bezdźwięczne , a zamiast tego wyróżniają się wyłącznie barwą . Dwa główne elementy brzmieniowe tych dźwięków to obwiednia i formant . Formant jest jak ustawienie filtra, tak jak w przypadku dźwięków samogłosek, ale ponieważ nie ma tonu do przefiltrowania, zamiast tego filtrujemy szum lub niezgłoszone tony . Dźwięki nierozbite to grupy częstotliwości, które nie mają ze sobą harmonicznej relacji, więc nie słyszymy ich jako nut. Pomyśl o dwóch różnych talerzach, jednym „wysokim” i „niskim”, jako przykładach szumu z dwoma różnymi formantami.
W przypadku spółgłosek bezdźwięcznych możemy mówić o dwóch podkategoriach: plosives , fricatives . Głośniki (/ t /, / p /, / k /) mają bardzo krótką obwiednię głośności , która bardzo szybko osiąga maksymalną głośność, a następnie równie szybko gaśnie. Jest to najbardziej podobne do dźwięku perkusji. Różne dźwięki formantów wybuchowych pochodzą od ich różnych formantów . W tym przypadku chodzi głównie o to, ile i jakiego rodzaju hałas jest wytwarzany wraz z dźwiękiem wybuchowym. Dźwięk A / p / zasadniczo nie ma szumu, jak bęben basowy, podczas gdy / t / i / k / mają dwa różne rodzaje szumów, które bardziej przypominają odpowiednio hi hat i werbel. Inną rzeczą, która sprawia, że dźwięk / t / różni się od / k /, jest inna pozycja ust, co powoduje różne filtrowanie , tak jak w przypadku dźwięków samogłosek.
Fricatives (/ f /, / s /, / sh /, / th /) to wszystkie wybuchy hałasu, które generalnie trwają dłużej niż wybuchy (mają wolniejszą obwiednię głośności ) i każdy ma swój własny formant lub ustawienie filtra , które zmienia charakter szumu. Zwróć uwagę, że / f / jest dość równym dźwiękiem, podczas gdy / s / ma większe wrażenie, że niektóre częstotliwości są głośniejsze niż inne, / sh / jest bardziej nierównym dźwiękiem, a / th / jest wyciszonym dźwiękiem bez większość wyższych częstotliwości.
W przypadku spółgłosek dźwięcznych większość z nich jest zasadniczo taka sama jak bezdźwięcznych opisanych powyżej, z wyjątkiem tego, że obejmują one również struny głosowe, więc jest znowu jakiś ton , kiedy wymawiane są dźwięczne spółgłoski. Te spółgłoski to / d / (dźwięczne / t /), / b / (dźwięczne / p /), / z / (dźwięczne / s /) i tak dalej. Uważam, że każda bezdźwięczna spółgłoska ma udźwięcznioną wersję w języku angielskim (uważam, że jest to również prawdą w języku japońskim).
Istnieje kilka dźwięcznych spółgłosek, które nie mają wersji bezdźwięcznych, a także znajdują się na granicy między spółgłoskami i samogłoskami . Dwa najbliższe samogłoskom są dźwięki / y / i / w /. Są to w zasadzie samogłoski, w których podczas ich wymawiania zmienia się formant lub filtr . Odbywa się to poprzez zmianę ułożenia języka lub warg, podczas gdy struny głosowe tworzą tonację .
Dwie inne, / m / i / n /, są zasadniczo podobne do nucąc, a głównym sposobem, w jaki odróżniamy różnicę, jest to, jak spółgłoska zmienia się w samogłoskę, aby określić, czy była to / m / czy / n /. Podczas przejścia na samogłoskę różnica między / m / i / n / jest podobna do różnicy między / w / i / y /.
Wreszcie, / l / i / r / są zasadniczo samogłoskami, które zastosuj raczej ekstremalne formanty lub filtry . Brzmią też inaczej, gdy się do nich zbliża i opuszcza (można to nazwać ich obwiednią formant / filtru ).
Jeśli naprawdę uważasz, zauważyłeś, że nie omówiłem wszystkich angielskich fonemów. Poruszyłem wszystkie muzyczne aspekty fonemów we wszystkich językach. Oto więcej szczegółów dotyczących podziału fonemów:
- Różne źródła dźwięków, w tym struny głosowe, które wytwarzają dźwięki i części ust, które mogą wydawać dźwięki
- Różne pozycje ust filtruj źródła dźwięku na różne sposoby, aby utworzyć różne formanty
- Różne obwiednie głośności lub jak zmienia się głośność w czasie
- Różne obwiednie formantów lub jak zmienia się filtrowanie w czasie
To są główne elementy, które odróżniają różne fonemy podsumowane terminami muzycznymi, a nie fonetycznymi.
Dla zabawy podzielmy słowa „cześć” i „do widzenia” muzycznie, tak jakbyśmy chcieli zrobić syntezator, wydając następujące dźwięki:
„Cześć”
- / h / - szum filtrowany, bardzo wyciszony i dość cichy
- / e / - przefiltrowana wysokość dźwięku, dość jasny filtr formantowy (rodzaj filtra pasmowoprzepustowego)
- / l / - przefiltrowana wysokość tonu, zmieniająca dramatycznie filtr formantowy w miarę rozwoju spółgłoski, wraz z spadek w obwiedni głośności ri ght w „środku” dźwięku / l /
- / o / - przefiltrowana wysokość dźwięku, osiągając znacznie ciemniejszy formant niż dźwięk / e /
" Do widzenia ”
- / g / - przefiltrowana wysokość dźwięku, obwiednia głośności z krótkim atakiem, krótki, cichy filtrowany szum szumu, filtr formantowy z obwiednią, która zaczyna się bardzo ciemno (jak dźwięk / n /), a następnie rozjaśnia się na bardzo krótki czas, a następnie szybko ustawia się w pozycji dla następnego fonemu
- / oo / - przefiltrowana wysokość dźwięku, zauważ, że jest podobna do a / u / formant
- / d / - przefiltrowana wysokość dźwięku jest kontynuowana, ale obwiednia głośności spada zasadniczo do zera na krótką chwilę, a następnie powraca do pierwotnej głośności z tym samym formantem (jak „duh”), prawdopodobnie z niewielkim szumem tuż po nadejściu głośności wykonać kopię zapasową
- / b / - ponownie głośność spada do zera, a następnie szybko pojawia się z tym samym formantem i wysokością (jak „buh”), ale bez szumu
- / y / lub / ai / - przemiatanie filtra formantowego z bieżącej / oo / lub / u / pozycji do znacznie jaśniejszego dźwięku, takiego jak / i /