Что общего между пением птиц и речью человека?
07 апреля 2025
Что общего между пением птиц и речью человека?
- 72
- 0
- 0
Рисунок в полном размере.
изображение адаптировано из научного журнала Royal society publishing
-
Авторы
-
Редакторы
Статья на конкурс «Био/Мол/Текст»: Наличие языка, способность к решению различных когнитивных задач часто рассматриваются как компоненты «сложного» поведения человека. Важной составляющей разговорного языка является способность к вокальному обучению или способность имитировать звуки. Развитое вокальное обучение было обнаружено лишь у нескольких таксонов, включая пять клад млекопитающих (люди, слоны, китообразные, ластоногие и летучие мыши) и три клады птиц (певчие птицы, попугаи и колибри). Интересно, что некоторые таксоны, демонстрирующие наиболее сложное вокальное поведение, совпадают с теми, которые, как давно считается, обладают более развитыми когнитивными способностями (люди, китообразные, слоны, певчие птицы и попугаи). Обучение вокалу — это сложное приобретенное социальное поведение. Благодаря сравнительным исследованиями стало известно, что нейронные сети, вовлеченные в вокальное обучение у птиц, имеют поразительные сходства с нейронными сетями, вовлеченными в проявление речевых функций. Так, певчие птицы стали идеальной животной моделью для изучения нейронных механизмов вокального обучения.
Конкурс «Био/Мол/Текст»-2024/2025
Эта работа опубликована в номинации «Свободная тема» конкурса «Био/Мол/Текст»-2024/2025.

Генеральный партнер конкурса — международная инновационная биотехнологическая компания BIOCAD.

Партнер номинации — компания SkyGen: передовой дистрибьютор продукции для life science на российском рынке.

«Книжный» спонсор конкурса — «Альпина нон-фикшн»

Рисунок 1. Животные, способные к вокальному обучению.
Чарльз Дарвин предположил, что «разница между психикой человека и высших млекопитающих в степени, а не в качестве» [1], [2]. Это утверждение вдохновило принять научное сообщество во внимание исследования, посвященные сравнительному анализу «языка» животных и человека. Несложно догадаться, что одной из предпосылок для формирования полноценной речи является способность к вокальной имитации [3], [4]. Такая способность характерна для некоторых морских млекопитающих, попугаев, колибри и певчих птиц [3–7], однако отсутствует у приматов (non-human primates), но не у человека [8], [9].

Рисунок 2. Чарльз Дарвин — английский натуралист и путешественник, автор книге «Происхождение видов», опубликованой в 1859 году.
Ч. Дарвин обнаружил удивительное сходство с процессом освоения языка у людей и разучиванием песен у птиц. С 1960-х годов начинаются многоплановые исследования, в ходе которых стало возможным провести все более четкие параллели между языком птиц и речью человека [7–13].
В чем же сходства?
Вокальное подражание — одна из самых загадочных форм обучения. После рождения дети начинают лепетать, эта форма поведения постепенно развивается в течение первого года жизни [14]. Такой лепет, как правило, состоит из простых и неструктурированных звуков, но уже через несколько месяцев можно выделить вокальные элементы, которые ребенок явно заимствует из родного для него языка, и эти структурированные звуки в дальнейшем превращаются в полноценные слова [15]. У птиц формирование песни проходит через схожие стадии [5]: например, молодые певчие птицы могут копировать с поразительной точностью слоги песен взрослых птиц, которые выступают в качестве «наставников» [16], [17].
Молодые птицы часто копируют и элементы песен друг у друга [18], [19] или импровизируют и смешивают слоги у разных наставников для создания новых типов песен [20], [21]. Кроме того, как у певчих птиц, так и у младенцев социальная обратная связь может оказывать влияние на вокальное развитие [22].
Итак, в чем же сходство? Во-первых, архитектура нейронных сетей у птиц и млекопитающих очень похожи [23]. Например, доказано функциональное сходство птичьих «песенных» областей со слуховой и моторной корой человека [24]. Во-вторых, структура языка и пения птиц, также имеют много общего [10], [12], [13]. В-третьих, ген FOXP2 играет ключевую роль в формировании речи, как уже неудивительно, но и в процессе вокального обучения у птиц [24–26].
Связь между способностью к решению когнитивных задач и вокальным обучением
Считается, что особенности, отражающие более сложное вокальное обучение у певчих птиц, включают в себя большой вокальный репертуар, способность к неограниченному вокальному обучению в течение всей жизни и способности к подражанию вокализациям других видов [27], [28].
Учеными были предприняты попытки поиска связи между когнитивными способностями и особенностью вокального обучения. Когнитивные способности животных чаще всего изучают в лабораторных условиях, используя различные батареи тестов (наборы экспериментальных тестов для комплексной оценки аспектов когнитивных функций). Так, совсем недавно, в 2023 году Жан-Николь Ауде, Мелани Кутюр и Эрих Д. Джарвис протестировали 214 особей 23 видов птиц в батарее поведенческих тестов. Авторы создали базу данных с характеристиками вокального обучения этих видов на основе 80 публикаций. Они обнаружили связь между сложностью вокального обучения и способностью к решению задач и относительным размером мозга [29].
При чем здесь слоны?
Оказалось, что, помимо птиц, вокально подражать могут два вида слонов: африканский (Loxodonta africana) и азиатский (Elephas maximus). Первые данные о способности к имитации были задокументированы у африканских слонов (Loxodonta africana) в 2005 году [30]. Последующие исследования вокального обучения слонов не проводились, пока в 2012 году не появилось сообщение об азиатском слоне (Elephas maximus), имитирующем речь человека [31], что расширило представления ученых о способности к вокальному обучению у Elephantidae (рис. 3).

Рисунок 3. Поза слона Кошика во время имитации речи. Кошик точно имитирует частоты речи путем помещения кончика хобота в рот (всегда с правой стороны) в начале фонации. Во время фонации он поднимает нижнюю челюсть, удерживая хобот внутри рта, таким образом моделируя форму голосового тракта.
Однако эти работы были выполнены на слонах в неволе. На сегодняшний день ученым крайне мало известно о вокальном обучении или его значении в системе естественной коммуникации. Более того, до недавнего времени знания о строении мозга слонов были весьма ограничены [32].
Сейчас известно, что африканские и азиатские слоны в основном вокализируют в инфразвуковом диапазоне [33], [34]. Наиболее заметным видовым отличием азиатских слонов в вокальном репертуаре являются высокочастотные повторяющиеся вокализации (щебетание/писк и визг), которые обычно отсутствуют у африканских видов [35]. Вокальный репертуар африканских и азиатских слонов насчитывает около 8–10 различных типов звуков [31], [36–40]. Действительно, это сравнительно немного, но слоны способны демонстрировать вокальную пластичность (между типами звуков и их комбинацией) [38], [40] и сложную, зависящую от контекста гибкость [41–45].
Слоны, как и люди, являются наземными, долгоживущими и социальными млекопитающими. Соответственно, адаптивная функция их вокального обучения, как и вокального обучения птиц, может помочь выявить зачатки формирования языка человека [4]. Однако эксперименты на этих животных в лабораторных или естественных условиях весьма затруднены, что делает немногочисленные эксперименты на слонах исключительными.

Рисунок 4. Слева — мозг человека, справа — мозг певчих птиц. Изображены некоторые области мозга человека и птиц, вовлеченные в вокальное обучение. NCM — каудомедиальный нидопаллиум (caudomedial nidopallium); HVC — высший вокальный центр (high vocal center); HP — гиппокамп.
Хорошо известно, что область Брока в левой лобной доле и область Вернике в левой височной доле являются центральными областями вокальной системы человека (рис. 4) [46]. Область Брока участвует в производстве речи, обработке синтаксиса языка. Область Вернике играет важную роль в восприятии и понимании речи [47],[48]. В мозге певчих птиц также существует вокальная система, которая вовлечена в формирование и воспроизведение песен. Каудомедиальный нидопаллиум (NCM) является частью слухового пути и может содержать нейронный субстрат для запоминания песен птицы-наставника. NCM является аналогом области Вернике в мозге человека. Высший вокальный центр (HVC) является частью вокального пути птиц, его можно рассматривать как аналог области Брока в мозге человека [46].
Опиоидная система
Акустическая коммуникация играет важную роль в выживании животных, особенно тех, которые живут в больших социальных группах. Многие виды используют врожденные вокализации для передачи информации, контекст которых приобретается из окружающей среды [49], [51]. Однако некоторые животные, такие как певчие птицы, развивают сложные вокальные репертуары, которые они учат на протяжении всей жизни. Эти репертуары важны для привлечения партнеров и маркировки территории, и их освоение схоже с процессом обучения речи у человеческих младенцев. Социальное взаимодействие является ключевым фактором в этом процессе, что подтверждается тем, что молодые птицы предпочитают живых наставников, а не записи вокализаций [51], [52].
Роль нейромодуляторов, таких как эндогенная опиоидная система, в этом процессе становится все более очевидной. Эта система, состоящая из мю- (μ-ORs), дельта- (δ-ORs) и каппа- (κ-ORs) опиоидных рецепторов и их эндогенных лигандов, регулирует аффективные состояния, такие как боль, удовольствие и вознаграждение. Хотя опиоидные рецепторы традиционно изучаются в контексте зависимости и болевых путей, недавние исследования показывают их влияние на обучение [53]. Например, у грызунов дефицит этих рецепторов ухудшает способность распознавать новые объекты, а у кур опиоидные рецепторы влияют на различение горьких предметов [54], [55].

Рисунок 5. Паттерн экспрессии мю- и дельта-опиоидных рецепторов и дофаминергическая система в ядрах контроля вокализации в мозге певчих птиц. Синие стрелки представляют связи HVC, красные стрелки — связи AFP, фиолетовые стрелки — дофаминергические входы. DLM — дорсолатеральное ядро медиального таламуса; LMAN — латеральное крупноклеточное ядро переднего нидопаллиума; RA — ядро аркопаллиума; SN — черная субстанция; VTA — вентральная тегментальная область.

Рисунок 6. Разговорный язык, или речь, рассматривается здесь как комбинация семи составляющих черт. Эти черты пересекаются с компонентами, изучаемыми в лингвистике: семантикой, прагматикой, синтаксисом. Красным цветом выделены компоненты, наиболее редко встречаемые среди позвоночных.
Несмотря на значительное внимание к опиоидным рецепторам в контексте зависимости, их роль в естественных процессах обучения, таких как вокальное обучение у птиц, остается недостаточно изученной. Исследования показывают, что опиоидные рецепторы могут модулировать когнитивные процессы, связанные с вокализацией, и потенциально регулировать мотивацию и способности к вокальному обучению у певчих птиц.
Критерии разговорного языка
Например, рудиментарная вокальная пластичность и способность к обучению были обнаружены у некоторых видов, считавшихся неспособными к вокальному обучению, включая мышей [58] и некоторых приматов [59], [60]. Тем не менее, в прошлом столетии удалось обучить элементарному языку жестов человекообразных обезьян: к своим 30 годам горилла Коко «произносила» более 1000 знаков американского языка жестов (ASL или амслен) в словосочетаниях, которым ее не учили, и распознавала ~2000 произносимых слов [61] (рис. 7).

Рисунок 7. Горилла Коко «разговаривала» на жестовом языке. Коко скончалась в среду утром во сне в возрасте 46 лет 19 июня 2018 года.
Заключение
Еще одно важное направление возможных будущих исследований — изучение лингвистической структуры и синтаксиса песен птиц. Сравнительные исследования должны помочь раскрыть возможные пути формирования языка и речи человека. Несмотря на возможность изучения зачатков языка на млекопитающих, видимо, на сегодняшний день самой удачной моделью для изучения зачатков языка все же являются певчие птицы.
Литература
- Utkarsha A. Singh, Soumya Iyengar. (2022). The Role of the Endogenous Opioid System in the Vocal Behavior of Songbirds and Its Possible Role in Vocal Learning. Front. Physiol.. 13;
- Darwin C. The Descent of Man, and Selection in Relation to Sex. John Murray, London, 1871;
- Marc D. Hauser, Noam Chomsky, W. Tecumseh Fitch. (2002). The Faculty of Language: What Is It, Who Has It, and How Did It Evolve?. Science. 298, 1569-1579;
- W.Tecumseh Fitch. (2000). The evolution of speech: a comparative review. Trends in Cognitive Sciences. 4, 258-267;
- Allison J. Doupe, Patricia K. Kuhl. (1999). BIRDSONG AND HUMAN SPEECH: Common Themes and Mechanisms. Annu. Rev. Neurosci.. 22, 567-631;
- Michael S. Brainard, Allison J. Doupe. (2002). What songbirds teach us about learning. Nature. 417, 351-358;
- Johan J. Bolhuis, Manfred Gahr. (2006). Neural mechanisms of birdsong memory. Nat Rev Neurosci. 7, 347-357;
- Moira J. Yip. (2006). The search for phonology in other species. Trends in Cognitive Sciences. 10, 442-446;
- Michael Balter. (2010). Animal Communication Helps Reveal Roots of Language. Science. 328, 969-971;
- Linda Wilbrecht, Fernando Nottebohm. (2003). Vocal learning in birds and humans. Ment. Retard. Dev. Disabil. Res. Rev.. 9, 135-148;
- Constance Scharff, Sebastian Haesler. (2005). An evolutionary perspective on FoxP2: strictly for the birds?. Current Opinion in Neurobiology. 15, 694-703;
- Kazuo Okanoya. (2004). Song Syntax in Bengalese Finches: Proximate and Ultimate Analyses. Advances in the Study of Behavior. 297-346;
- Kazuo Okanoya. (2007). Language evolution and an emergent property. Current Opinion in Neurobiology. 17, 271-276;
- D. Kimbrough Oller The Emergence of the Speech Capacity — Psychology Press, 2000;
- D. Kimbrough Oller, Leslie A. Wieman, William J. Doyle, Carol Ross. (1976). Infant babbling and speech. J. Child Lang.. 3, 1-11;
- Thorpe, W. H. Learning and Instinct in Animals. Methuen, London, 1963;
- Peter Marler. (1970). A comparative approach to vocal learning: Song development in white-crowned sparrows.. Journal of Comparative and Physiological Psychology. 71, 1-25;
- Sébastien Derégnaucourt, Manfred Gahr. (2013). Horizontal transmission of the father's song in the zebra finch (Taeniopygia guttata). Biol. Lett.. 9, 20130247;
- Susan F. Volman, Hitesh Khanna. (1995). Convergence of untutored song in group-reared zebra finches (Taeniopygia guttata).. Journal of Comparative Psychology. 109, 211-221;
- Lucy A. Eales. (1985). Song learning in zebra finches: some effects of song model availability on what is learnt and when. Animal Behaviour. 33, 1293-1300;
- Alex E. Jones, Carel ten Cate, Peter J. B. Slater. (1996). Early experience and plasticity of song in adult male zebra finches (Taeniopygia guttata).. Journal of Comparative Psychology. 110, 354-369;
- Michael H. Goldstein, Jennifer A. Schwade. (2008). Social Feedback to Infants' Babbling Facilitates Rapid Phonological Learning. Psychol Sci. 19, 515-523;
- Anton Reiner, David J. Perkel, Laura L. Bruce, Ann B. Butler, András Csillag, et. al.. (2004). Revised nomenclature for avian telencephalon and some related brainstem nuclei. J of Comparative Neurology. 473, 377-414;
- Erich D. Jarvis, Onur Güntürkün, Laura Bruce, András Csillag, Harvey Karten, et. al.. (2005). Avian brains and a new understanding of vertebrate brain evolution. Nat Rev Neurosci. 6, 151-159;
- Simon E. Fisher, Constance Scharff. (2009). FOXP2 as a molecular window into speech and language. Trends in Genetics. 25, 166-177;
- Sebastian Haesler, Christelle Rochefort, Benjamin Georgi, Pawel Licznerski, Pavel Osten, Constance Scharff. (2007). Incomplete and Inaccurate Vocal Imitation after Knockdown of FoxP2 in Songbird Basal Ganglia Nucleus Area X. PLoS Biol. 5, e321;
- William A. Searcy, Jill Soha, Susan Peters, Stephen Nowicki. (2021). Variation in vocal production learning across songbirds. Phil. Trans. R. Soc. B. 376;
- Cristina M Robinson, Kate T Snyder, Nicole Creanza. (2019). Correlated evolution between repertoire size and song plasticity predicts that sexual selection on song promotes open-ended learning. eLife. 8;
- Jean-Nicolas Audet, Mélanie Couture, Erich D. Jarvis. (2023). Songbird species that display more-complex vocal learning are better problem-solvers and have larger brains. Science. 381, 1170-1175;
- Joyce H. Poole, Peter L. Tyack, Angela S. Stoeger-Horwath, Stephanie Watwood. (2005). Elephants are capable of vocal learning. Nature. 434, 455-456;
- Angela S. Stoeger, Daniel Mietchen, Sukhun Oh, Shermin de Silva, Christian T. Herbst, et. al.. (2012). An Asian Elephant Imitates Human Speech. Current Biology. 22, 2144-2148;
- Bruno Cozzi, Silvia Spagnoli, Lucia Bruno. (2001). An overview of the central nervous system of the elephant through a critical appraisal of the literature published in the XIX and XX centuries. Brain Research Bulletin. 54, 219-227;
- Katharine B. Payne, William R. Langbauer, Elizabeth M. Thomas. (1986). Infrasonic calls of the Asian elephant (Elephas maximus). Behav Ecol Sociobiol. 18, 297-301;
- Joyce H. Poole, Katherine Payne, William R. Langbauer, Cynthia J. Moss. (1988). The social contexts of some very low frequency calls of African elephants. Behav Ecol Sociobiol. 22, 385-392;
- Angela S. Stoeger, Shermin de Silva. (2014). African and Asian Elephant Vocal Communication: A Cross-Species Comparison. Biocommunication of Animals. 21-39;
- Angela S. Stoeger-Horwath, Simon Stoeger, Harald. M. Schwammer, Helmut Kratochvil. (2007). Call repertoire of infant African elephants: First insights into the early vocal ontogeny. The Journal of the Acoustical Society of America. 121, 3922-3931;
- K. M. LEONG, A. ORTOLANI, K. D. BURKS, J. D. MELLEN, A. SAVAGE. (2003). QUANTIFYING ACOUSTIC AND TEMPORAL CHARACTERISTICS OF VOCALIZATIONS FOR A GROUP OF CAPTIVE AFRICAN ELEPHANTSLOXODONTA AFRICANA. Bioacoustics. 13, 213-231;
- Shermin de Silva. (2010). Acoustic communication in the Asian elephant, Elephas maximus maximus. Behav. 147, 825-852;
- Smita Nair, Rohini Balakrishnan, Chandra Sekhar Seelamantula, R. Sukumar. (2009). Vocalizations of wild Asian elephants (Elephas maximus): Structural classification and social context. The Journal of the Acoustical Society of America. 126, 2768-2778;
- Poole J. (2011). The behavioral context of African elephant acoustic communication. // In: The Amboseli Elephants: A Long-Term Perspective on a Long-Lived MammalChapter. University of Chicago Press;
- Lucy E. King, Joseph Soltis, Iain Douglas-Hamilton, Anne Savage, Fritz Vollrath. (2010). Bee Threat Elicits Alarm Call in African Elephants. PLoS ONE. 5, e10346;
- Joseph Soltis, Tracy E. Blowers, Anne Savage. (2011). Measuring positive and negative affect in the voiced sounds of African elephants (Loxodonta africana). The Journal of the Acoustical Society of America. 129, 1059-1066;
- Angela S. Stoeger, Benjamin D. Charlton, Helmut Kratochvil, W. Tecumseh Fitch. (2011). Vocal cues indicate level of arousal in infant African elephant roars. The Journal of the Acoustical Society of America. 130, 1700-1710;
- Daniel T. Blumstein. (2013). Evolution of Emotional Communication: From Sounds in Nonhuman Mammals to Speech and Music in Man. Series in Affective Science. Edited by Eckart Altenmüller, Sabine Schmidt, and Elke Zimmermann. Oxford and New York: Oxford University Press. £49.99. xiv + 376 p.; ill.; author and subject indexes. ISBN: 978-0-19-958356-0. 2013.. The Quarterly Review of Biology. 88, 342-343;
- Joseph Soltis, Lucy E. King, Iain Douglas-Hamilton, Fritz Vollrath, Anne Savage. (2014). African Elephant Alarm Calls Distinguish between Threats from Humans and Bees. PLoS ONE. 9, e89403;
- Sanne Moorman, Sharon M. H. Gobes, Ferdinand C. van de Kamp, Matthijs A. Zandbergen, Johan J. Bolhuis. (2015). Learning-related brain hemispheric dominance in sleeping songbirds. Sci Rep. 5;
- Johan J. Bolhuis, Kazuo Okanoya, Constance Scharff. (2010). Twitter evolution: converging mechanisms in birdsong and human speech. Nat Rev Neurosci. 11, 747-759;
- Johan J. Bolhuis, Martin Everaert. Birdsong, Speech, and Language: Exploring the Evolution of Mind and Brain. The MIT Press, 2013;
- M.S. DeVries, M.A. Cordes, S.A. Stevenson, L.V. Riters. (2015). Differential relationships between D1 and D2 dopamine receptor expression in the medial preoptic nucleus and sexually-motivated song in male European starlings (Sturnus vulgaris). Neuroscience. 301, 289-297;
- Franziska Wegdell, Kurt Hammerschmidt, Julia Fischer. (2019). Conserved alarm calls but rapid auditory learning in monkey responses to novel flying objects. Nat Ecol Evol. 3, 1039-1042;
- Zann, R. A. The Zebra Finch: A Synthesis of Field and Laboratory Studies. Oxford: Oxford University Press, 1996;
- M.S.A. Fernandez, C. Vignal, H.A. Soula. (2017). Impact of group size and social composition on group vocal activity and acoustic network in a social songbird. Animal Behaviour. 127, 163-178;
- Jesus Bertran-Gonzalez, Vincent Laurent, Billy C. Chieng, MacDonald J. Christie, Bernard W. Balleine. (2013). Learning-Related Translocation of δ-Opioid Receptors on Ventral Striatal Cholinergic Interneurons Mediates Choice between Goal-Directed Actions. J. Neurosci.. 33, 16060-16071;
- Marlene A Wilson, Lorain Junor. (2008). The Role of Amygdalar Mu-Opioid Receptors in Anxiety-Related Responses in Two Rat Models. Neuropsychopharmacol. 33, 2957-2968;
- Cherkaouia Kibaly, Chi Xu, Catherine M. Cahill, Christopher J. Evans, Ping-Yee Law. (2019). Non-nociceptive roles of opioids in the CNS: opioids’ effects on neurogenesis, learning, memory and affect. Nat Rev Neurosci. 20, 5-18;
- Erich D. Jarvis. (2019). Evolution of vocal learning and spoken language. Science. 366, 50-54;
- ERICH D. JARVIS. (2004). Learned Birdsong and the Neurobiology of Human Language. Annals of the New York Academy of Sciences. 1016, 749-777;
- Gustavo Arriaga, Erich D. Jarvis. (2013). Mouse vocal communication system: Are ultrasounds learned or innate?. Brain and Language. 124, 96-116;
- Christopher I. Petkov, Erich D. Jarvis. (2012). Birds, primates, and spoken language origins: behavioral phenotypes and neurobiological substrates. Front. Evol. Neurosci.. 4;
- Adriano R. Lameira. (2017). Bidding evidence for primate vocal learning and the cultural substrates for speech evolution. Neuroscience & Biobehavioral Reviews. 83, 429-439;
- Patterson F. Linden E. The Education of Koko. Holt Rinehart & Winston, 1981.