Z punktu widzenia muzyki, jakie właściwości zmienia ludzki głos, aby wytwarzać różne słowa / sylaby?

Pytanie:

JShorthouse

2019-04-19 21:52:49 UTC

view on stackexchange narkive permalink

Dlaczego na przykład słowo „cześć” brzmi zupełnie inaczej niż słowo „do widzenia” lub litera „a” z litery „b”?

Wiem, że nie może być tonem, ponieważ wszystkie te słowa i sylaby mogą być wypowiadane w tej samej tonacji i nadal brzmią odrębnie, a zmiana tekstu piosenki nie zmienia wysokości. słowa brzmią inaczej?

https://en.wikipedia.org/wiki/Timbre

Co za zbieg okoliczności! Właśnie czytając to pytanie oglądam w telewizji https://vimeo.com/ondemand/derklangderstimmefilm

Trzy odpowiedzi:

Todd Wilcox

2019-04-19 23:20:27 UTC

view on stackexchange narkive permalink

Jak zauważył Michael Curtis, od strony językowej badanie fonetyki polega na tym, jakie dźwięki mowy wydają ludzie i jak je wytwarzają. Fonetyka nie podchodzi do rzeczy z muzycznego punktu widzenia, więc pomyślałem, że może spróbuję dokonać pewnych korelacji między fonetyką a akustyką muzyczną.

Fonetyka dzieli dźwięki mowy (fonemy) na dwie szerokie kategorie: samogłoski i spółgłoski . Linie mogą być tam nieco rozmyte, ale samogłoski zawsze dotyczą strun głosowych i zwykle są wydawane z mniej lub bardziej otwartymi ustami, podczas gdy spółgłoski obejmują określone ruchy zębów, warg i języka i mogą, ale nie muszą, używać strun głosowych .

W przypadku samogłosek zawsze używamy naszych strun głosowych, co oznacza, że samogłoski zawsze mają jakąś wysokość . Dźwięki używane podczas mowy generalnie nie mają typowego związku muzycznego, ale czasami mogą być „przypadkowo” muzyczne. Na przykład, kiedy dziecko drwi na placu zabaw w stylu „Johnny is a chick-en!”, Często śpiewają melodyjną tercję. Ale to przypadek.

Sposób, w jaki wydajemy różne dźwięki samogłosek, polega na zmianie kształtu naszych ust, a to zmienia barwę dźwięku wytwarzanego przez nasze struny głosowe. Innym muzycznym sposobem spojrzenia na to jest to, że filtrujemy (tak jak w przypadku korektora lub filtra syntezatora) wysokość dźwięku, która jest tworzona przez nasze struny głosowe.

To całkowicie obejmuje muzyczne aspekty dźwięków samogłosek. Moglibyśmy mówić o głośności i czasie trwania (dwóch innych głównych wymiarach muzyki), ale żaden z nich nie zmienia dźwięku samogłosek, który wydajemy lub słyszymy.

Spółgłoski są bardziej skomplikowane. Podzielmy je na kategorie fonetyczne dźwięczne (używając strun głosowych) i bezdźwięczne (nie używając strun głosowych).

Spółgłoski bezdźwięczne (takie jak / t /, / p /, / f /, / k /, / s /) z muzycznego punktu widzenia są najbliższe dźwiękom perkusji. To są rodzaje dźwięków, które wydajemy, gdy bijemy z pudełka. Dźwięki perkusyjne i bezdźwięczne spółgłoski są muzycznie bezdźwięczne , a zamiast tego wyróżniają się wyłącznie barwą . Dwa główne elementy brzmieniowe tych dźwięków to obwiednia i formant . Formant jest jak ustawienie filtra, tak jak w przypadku dźwięków samogłosek, ale ponieważ nie ma tonu do przefiltrowania, zamiast tego filtrujemy szum lub niezgłoszone tony . Dźwięki nierozbite to grupy częstotliwości, które nie mają ze sobą harmonicznej relacji, więc nie słyszymy ich jako nut. Pomyśl o dwóch różnych talerzach, jednym „wysokim” i „niskim”, jako przykładach szumu z dwoma różnymi formantami.

W przypadku spółgłosek bezdźwięcznych możemy mówić o dwóch podkategoriach: plosives , fricatives . Głośniki (/ t /, / p /, / k /) mają bardzo krótką obwiednię głośności , która bardzo szybko osiąga maksymalną głośność, a następnie równie szybko gaśnie. Jest to najbardziej podobne do dźwięku perkusji. Różne dźwięki formantów wybuchowych pochodzą od ich różnych formantów . W tym przypadku chodzi głównie o to, ile i jakiego rodzaju hałas jest wytwarzany wraz z dźwiękiem wybuchowym. Dźwięk A / p / zasadniczo nie ma szumu, jak bęben basowy, podczas gdy / t / i / k / mają dwa różne rodzaje szumów, które bardziej przypominają odpowiednio hi hat i werbel. Inną rzeczą, która sprawia, że dźwięk / t / różni się od / k /, jest inna pozycja ust, co powoduje różne filtrowanie , tak jak w przypadku dźwięków samogłosek.

Fricatives (/ f /, / s /, / sh /, / th /) to wszystkie wybuchy hałasu, które generalnie trwają dłużej niż wybuchy (mają wolniejszą obwiednię głośności ) i każdy ma swój własny formant lub ustawienie filtra , które zmienia charakter szumu. Zwróć uwagę, że / f / jest dość równym dźwiękiem, podczas gdy / s / ma większe wrażenie, że niektóre częstotliwości są głośniejsze niż inne, / sh / jest bardziej nierównym dźwiękiem, a / th / jest wyciszonym dźwiękiem bez większość wyższych częstotliwości.

W przypadku spółgłosek dźwięcznych większość z nich jest zasadniczo taka sama jak bezdźwięcznych opisanych powyżej, z wyjątkiem tego, że obejmują one również struny głosowe, więc jest znowu jakiś ton , kiedy wymawiane są dźwięczne spółgłoski. Te spółgłoski to / d / (dźwięczne / t /), / b / (dźwięczne / p /), / z / (dźwięczne / s /) i tak dalej. Uważam, że każda bezdźwięczna spółgłoska ma udźwięcznioną wersję w języku angielskim (uważam, że jest to również prawdą w języku japońskim).

Istnieje kilka dźwięcznych spółgłosek, które nie mają wersji bezdźwięcznych, a także znajdują się na granicy między spółgłoskami i samogłoskami . Dwa najbliższe samogłoskom są dźwięki / y / i / w /. Są to w zasadzie samogłoski, w których podczas ich wymawiania zmienia się formant lub filtr . Odbywa się to poprzez zmianę ułożenia języka lub warg, podczas gdy struny głosowe tworzą tonację .

Dwie inne, / m / i / n /, są zasadniczo podobne do nucąc, a głównym sposobem, w jaki odróżniamy różnicę, jest to, jak spółgłoska zmienia się w samogłoskę, aby określić, czy była to / m / czy / n /. Podczas przejścia na samogłoskę różnica między / m / i / n / jest podobna do różnicy między / w / i / y /.

Wreszcie, / l / i / r / są zasadniczo samogłoskami, które zastosuj raczej ekstremalne formanty lub filtry . Brzmią też inaczej, gdy się do nich zbliża i opuszcza (można to nazwać ich obwiednią formant / filtru ).

Jeśli naprawdę uważasz, zauważyłeś, że nie omówiłem wszystkich angielskich fonemów. Poruszyłem wszystkie muzyczne aspekty fonemów we wszystkich językach. Oto więcej szczegółów dotyczących podziału fonemów:

Różne źródła dźwięków, w tym struny głosowe, które wytwarzają dźwięki i części ust, które mogą wydawać dźwięki
Różne pozycje ust filtruj źródła dźwięku na różne sposoby, aby utworzyć różne formanty
Różne obwiednie głośności lub jak zmienia się głośność w czasie
Różne obwiednie formantów lub jak zmienia się filtrowanie w czasie

To są główne elementy, które odróżniają różne fonemy podsumowane terminami muzycznymi, a nie fonetycznymi.

Dla zabawy podzielmy słowa „cześć” i „do widzenia” muzycznie, tak jakbyśmy chcieli zrobić syntezator, wydając następujące dźwięki:

„Cześć”

/ h / - szum filtrowany, bardzo wyciszony i dość cichy
/ e / - przefiltrowana wysokość dźwięku, dość jasny filtr formantowy (rodzaj filtra pasmowoprzepustowego)
/ l / - przefiltrowana wysokość tonu, zmieniająca dramatycznie filtr formantowy w miarę rozwoju spółgłoski, wraz z spadek w obwiedni głośności ri ght w „środku” dźwięku / l /
/ o / - przefiltrowana wysokość dźwięku, osiągając znacznie ciemniejszy formant niż dźwięk / e /

" Do widzenia ”

/ g / - przefiltrowana wysokość dźwięku, obwiednia głośności z krótkim atakiem, krótki, cichy filtrowany szum szumu, filtr formantowy z obwiednią, która zaczyna się bardzo ciemno (jak dźwięk / n /), a następnie rozjaśnia się na bardzo krótki czas, a następnie szybko ustawia się w pozycji dla następnego fonemu
/ oo / - przefiltrowana wysokość dźwięku, zauważ, że jest podobna do a / u / formant
/ d / - przefiltrowana wysokość dźwięku jest kontynuowana, ale obwiednia głośności spada zasadniczo do zera na krótką chwilę, a następnie powraca do pierwotnej głośności z tym samym formantem (jak „duh”), prawdopodobnie z niewielkim szumem tuż po nadejściu głośności wykonać kopię zapasową
/ b / - ponownie głośność spada do zera, a następnie szybko pojawia się z tym samym formantem i wysokością (jak „buh”), ale bez szumu
/ y / lub / ai / - przemiatanie filtra formantowego z bieżącej / oo / lub / u / pozycji do znacznie jaśniejszego dźwięku, takiego jak / i /

To jest dobra odpowiedź. Jeśli chodzi o formanty, OP może spróbować wypowiedzieć słowo „wow” powoli w monotonnym tonie i wyolbrzymić początkowe (zamknięte), środkowe (otwarte) i końcowe (zamknięte) formanty. Jest to w przybliżeniu to samo, co filtr sterowany napięciem w syntezatorze analogowym. Aby uzyskać kolejny wgląd w to, jak ludzkie usta mogą rzeźbić wypowiedzi wokalne w interesujące muzycznie frazy, posłuchaj słynnego użycia „Talk Box” Petera Framptona w programie Frampton Comes Alive. Jeszcze innym podejściem jest posłuchanie lub przeczytanie i poznanie przykładów sprzętu i technik „Vocoder”.

Niezła odpowiedź! Jeśli chodzi o twoją dyskusję na temat tonu, warto zauważyć, że w niektórych językach (najbardziej znanych w chińskim mandaryńskim) wysokość samogłosek ma w rzeczywistości znaczenie semantyczne; a nawet w języku angielskim końce zdań mają tendencję do pochylania się w górę lub w dół, w zależności od tego, czy są to pytania, czy stwierdzenia.

Ponadto, jeśli chodzi o twoje stwierdzenie na temat spółgłosek bezdźwięcznych i dźwięcznych: / x / jest używany w niektórych angielskich dialektach (np. "Loch"), ale / ɣ / nie jest używany w żadnym. Twoje stwierdzenie jest prawdziwe w wielu (większości?) Angielskich dialektach.

@JimL. Interesująca jest również technologia VoSim, prosty sposób syntezy dźwięków samogłosek z synchronizacją oscylatora i modulacją amplitudy, ale bez żadnego filtrowania. Oto przykład: https://www.youtube.com/watch?v=7GetTjx96D0&t=0m43s

Oprogramowanie Vocaloid również może być interesujące.

To doskonała odpowiedź, ale nie jestem pewien, czy główną różnicą w nosach jest opadanie. Tam, gdzie powietrze nie wychodzi z ust, zmienia się przestrzeń rezonansowa. [ŋ] (ng) raczej odcina przestrzeń rezonansową. [n] pozwala na trochę więcej miejsca. A [m] pozwala wykorzystać całe usta jako przestrzeń rezonansową. Ta różnica jest zauważalna nawet wtedy, gdy nos jest trzymany bez puszczania, jak podczas buczenia. Dlatego chóry uczą się nucić z otwartą szczęką, co brzmi zupełnie inaczej niż z zamkniętą szczęką. Również [ŋ] w języku angielskim rzadko ma offglide, ale możemy to usłyszeć w porównaniu z [n].

Michael Curtis

2019-04-19 22:15:28 UTC

view on stackexchange narkive permalink

Myślę, że najlepiej by Ci służyła lingwistyka , a konkretnie fonetyka.

Ton jest czymś w rodzaju elementu, ale specyficzny pitch nie jest problemem. Zamiast tego niektóre dźwięki wokalne są „dźwięczne”, co oznacza, że struny głosowe wibrują (wytwarzając wysokość). Na przykład f w 'fan nie jest dźwięczny, ale gdy jest dźwięczny, staje się v jak „van”.

To, jak wytwarzane są samogłoski i spółgłoski, jest rozumiane w językoznawstwie jako kwestia anatomii głosu języka, palety itp. i opisywane za pomocą terminów takich jak frykcyjny , wargowy , itp. W językoznawstwie występuje złożone mapowanie wnętrza jamy ustnej.

Działania głosu można opisać akustyką terminami takimi jak amplitutde, wave forma itp. Ale językoznawstwo ma w rzeczywistości całą gałąź poświęconą badaniu dźwięków wokalnych.

Nawiasem mówiąc, w treningu głosu te tematy nazywa się dykcją .

Phoenix + fonetyka = fonetyka! :-) ... poprawiam literówkę, dzięki!

Znalazłem inną z moich własnych literówek: „najlepszy serwer” zamiast „najlepiej obsługiwany” ... czy możesz powiedzieć, że pracuję w obsłudze komputerów?

topo Reinstate Monica

2019-04-20 02:40:14 UTC

view on stackexchange narkive permalink

Inne odpowiedzi wskazują, że istotą odpowiedzi jest barwa. Jeśli jednak zauważyłeś brak terminów muzycznych do opisania barwy, to myślę, że masz rację! Teoria muzyki tak naprawdę nie dostarcza terminów opisujących barwę ogólnie z taką samą zwięzłością, jaką może opisać wysokość i rytm.

Częściowo jest to spowodowane tym, że jeden z przez lata główne przypadki użycia koncepcji teorii muzyki polegały na dostarczaniu instrukcji wykonawczych - a przy tradycyjnych instrumentach (akustycznych) najskuteczniejszym sposobem jest po prostu określenie instrumentu, na którym ma być grana partia, i dodanie dowolnego innego instrukcje wykonania do partytury.

Oczywiście głosem ludzkim tekst jest również dodawany do partytury! Tak więc dokładna, choć trywialna odpowiedź na twoje pytanie, dlaczego cześć brzmi inaczej niż pożegnanie, może brzmieć: „teksty są różne”… chociaż nie wydaje się, aby to był duch, w jakim zadawane jest twoje pytanie.

Pogrubiłem terminy muzyczne, których użyłem w mojej odpowiedzi. Myślałem, że dzięki temu łatwo będzie je rozpoznać jako terminy muzyczne, ale może się myliłem.

@ToddWilcox, o ile widzę, zgadzamy się. O formantach wokalnych można mówić, jeśli chodzi o wypowiadane słowa - tak jak w moim komentarzu na temat pisania tekstów w partyturze. Jednak tak naprawdę nie ma żadnych abstrakcji teorii muzyki, o których jestem świadomy, których można by użyć do opisania, powiedzmy, dźwięku bębna lub zniekształconej gitary w tych samych warunkach.

Powiedziałbym również, że myślenie takie jak filtracja * nie * jest zwykle traktowane jako podstawowe pojęcia teorii. Rzadko o tym - ani w wielu innych sposobach potraktowania barwy - wspomina się w podstawowych przewodnikach teoretycznych.

W ogóle nie myślałem o koncepcjach * teorii * muzyki. Nie wydaje mi się, żeby pytanie dotyczyło teorii muzyki lub pytania o terminy z teorii muzyki.

@ToddWilcox Po prostu podchwyciłem frazowanie, takie jak „w * muzycznych * terminach”, „jaka * muzyczna * właściwość” w OP i odpowiadałem pod tym kątem. To rzeczywiście może nie być najważniejsza część tego, co chciał wiedzieć op ... ale myślałem, że to inna perspektywa.

Widzę, że leksykon terminów „muzycznych” jest znacznie szerszy niż leksykon terminów „teorii muzyki”, ale rozumiem, że to tylko mój osobisty pogląd. Na przykład, dla mnie „zwolennik koperty” to termin muzyczny, który nie jest terminem z teorii muzyki.

@ToddWilcox, który wydaje się rozsądnym sposobem patrzenia na rzeczy!

@Todd Wilcox Ciekawe spojrzenie na sposób, w jaki klasycznie wykształceni muzycy ignorują „dźwięk”, i np. myślę, że każda piosenka rockowa jest taka sama (4/4, skala pentatoniczna, tonacja E, gitary elektryczne ...), podczas gdy fani rocka mogą zidentyfikować tysiące piosenek po wysłuchaniu zaledwie kilku sekund, ponieważ mają inny sposób słuchania, można znaleźć w „The Revolution of Complex Sounds” Tristana Muraila (Przegląd Muzyki Współczesnej, tom 24, nr 2/3, kwiecień / czerwiec 2005, s. 121-135). Opisuje również, jak wykorzystuje w swojej muzyce „dźwięk”, np. wykorzystując harmonię opartą na falach pulsacyjnych i widmach filtrowanych grzebieniem.

@YourUncleBob To interesujące, ponieważ jestem klasycznie wyszkolony i myślę, że cała barokowa muzyka klawesynowa brzmi tak samo, podczas gdy muzyka rockowa ma tak wiele wariacji, że jest to dla mnie oczywiste. Spodziewam się, że wielu fanów muzyki klasycznej zwróci uwagę na „dźwięk”, ponieważ często słyszą różnicę między różnymi orkiestrami i miejscami. Mam na myśli zwłaszcza zespoły instrumentów z epoki, grające zasadniczo te same rzeczy, co zespoły instrumentów współczesnych, ale wyraźnie odmienne.

@ToddWilcox Cała barokowa muzyka klawesynowa rzeczywiście brzmi tak samo, to fakt naukowy. Trudno jest wyjaśnić poglądy Murail w komentarzu tutaj; artykuł jest dostępny online, choć najwyraźniej za paywallami.

ⓘ

To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 4.0, w ramach której jest rozpowszechniana.

o nas - informacje prawne