19.05.2025 19 693 0 +666 ojosigi

Мозг: открытие наконец-то проливает свет на тайну стойких привычек

---

+666

В закладки

Мозг: открытие наконец-то проливает свет на тайну стойких привычек может, обучения, сигнал, вознаграждения, Маркус, предсказания, нейроны, системы, система, исследования, действия, более, области, могут, основе, часть, стриатума, умолчанию, объяснить, СтивенсонДжонс

Нейробиологи обнаружили вторую систему обучения в мозге, которая может объяснить устойчивость привычек, даже самых сильных. Если классическая система основана на предсказании вознаграждения, то новый механизм обновляет частоту действий, закрепляя привычки — как полезные, так и вредные.

Люди и животные делают выбор через обучение методом проб и ошибок. Здесь переплетаются две динамики: стремление к вознаграждению и склонность повторять прошлые действия. Первая, ценностно-ориентированная, задействует дофаминовые нейроны, которые обрабатывают так называемую «ошибку предсказания вознаграждения» (Reward Prediction Error, RPE). Этот сигнал указывает, было ли действие выгодным.

Параллельно вторая динамика, больше связанная с движением, способствует повторению поведения. Эта гипотеза основана, в частности, на наблюдении за пациентами с болезнью Паркинсона: они испытывают трудности с автоматическими действиями, такими как ходьба, но иногда могут выполнять более сложные и адаптивные движения, например, фигурное катание, что кажется парадоксальным.

Команда из Sainsbury Wellcome Centre (SWC), связанного с University College London, предполагает, что второй дофаминовый путь может объяснить этот феномен. Этот сигнал, названный «ошибкой предсказания действия» (Action Prediction Error, APE), представляет собой систему обучения, параллельную RPE, которая направляет выбор не на основе ценности, а на основе частоты.

Пример: вы пробуете новое блюдо в ресторане. Если оно вам нравится, вы вернётесь и закажете его снова, не задумываясь. Эта стратегия постепенно становится вашим поведением по умолчанию. Именно такое повторяющееся поведение и закрепляет сигнал APE.

«Мы считаем, что обнаружили фундаментальный механизм формирования привычек», — говорит Маркус Стивенсон-Джонс, руководитель группы в SWC и ведущий автор исследования. «Как только действие становится предпочтительным, мозг может переключиться с оценки на основе ценности на автоматическое воспроизведение прошлого поведения».

Важно отметить, что не все привычки полезны. Некоторые, например компульсивное поведение или зависимости, могут быть вредными. По словам авторов, открытие этой двойной системы обучения может открыть новые пути для терапии как поведенческих расстройств, так и нейродегенеративных заболеваний, таких как болезнь Паркинсона.

Двойная система обучения в действии

Предыдущие исследования выявили три области среднего мозга, где дофаминовые нейроны участвуют в обучении: вентральная область покрышки, компактная часть чёрной субстанции и латеральная часть чёрной субстанции. Большинство из них участвуют в обработке вознаграждения, а некоторые — в координации движений. До сих пор было неясно, как эти функции распределяются и взаимодействуют.

Теперь выяснилось, что нейроны RPE отправляют сигналы по всему стриатуму, кроме его «хвоста» — задней области. В то же время нейроны, связанные с двигательными сигналами, охватывают весь стриатум, кроме прилежащего ядра, известного своей ролью в системе вознаграждения. Такое анатомическое распределение подтверждает функциональную специализацию: прилежащее ядро обрабатывает только ценность вознаграждения, а хвост стриатума участвует в двигательном повторении.

Чтобы проверить эту гипотезу, исследователи провели серию экспериментов на мышах. У части грызунов повреждали стриатум, другая группа служила контролем. Затем мышей обучали выполнять задания на слуховое различение. С помощью генетически закодированного датчика дофамина учёные смогли наблюдать динамику выделения нейромедиатора.

Результаты выявили типичный дофаминовый сигнал в хвостатой части стриатума, связанный не с наградой, а с повторяющимся действием. На первых этапах мыши в обеих группах обучались с одинаковой скоростью. Однако после достижения 60–70% успеха — порога, на котором у них начинала формироваться предпочтительная стратегия, — контрольная группа прогрессировала быстрее, вплоть до достижения так называемого «экспертного» уровня. Мыши с поврежденным стриатумом продолжали обучаться, но без ускорения и без формирования предпочтений.

«Мыши с повреждениями используют только сигнал RPE (ошибки предсказания вознаграждения). Остальные опираются на оба сигнала — RPE и APE (ошибки предсказания действия), что позволяет им прочнее закреплять свои выборы», — резюмирует Маркус Стивенсон-Джонс.

Чтобы подтвердить эту гипотезу, исследователи отключили хвостатую часть стриатума у мышей, уже достигших высокого уровня выполнения задачи. Их эффективность резко снизилась. Это указывает на то, что данный регион, благодаря сигналу APE, критически важен для поддержания ассоциаций, закрепленных через повторение.

Эта двойная система обучения может объяснить, почему так трудно избавиться от некоторых привычек, особенно если они повторялись годами. По мнению авторов исследования, ключом может стать постепенная замена одной действия другим — тоже повторяющимся. Например, систематическая замена сигареты никотиновой жвачкой задействует систему APE, чтобы сформировать новую привычку, вытесняющую старую.

«Теперь, когда мы знаем о существовании этой второй системы, у нас есть научная основа для разработки новых терапевтических подходов, направленных на вредные привычки», — подчеркивает Маркус Стивенсон-Джонс. «До сих пор большинство исследований зависимостей и компульсий фокусировались на прилежащем ядре. Наша работа смещает внимание на другие области мозга, такие как хвостатое ядро, которые могут оказаться решающими», — заключает он.

Система по умолчанию, экономящая ресурсы

Одно из главных преимуществ этой новой системы — более экономичное хранение информации. Избегая постоянного сравнения между различными вариантами, мозг может направлять когнитивные ресурсы на принятие более сложных решений.

«Эта система по умолчанию позволяет освободить когнитивную "полосу пропускания", что полезно для других процессов принятия решений, основанных на оценке ценности», — поясняет Маркус Стивенсон-Джонс. Конкретный пример: научившись водить, человек может сосредоточиться на разговоре, не задумываясь о каждом техническом действии. Теперь команда планирует детально изучить, как системы APE и RPE взаимодействуют и как каждая из них участвует в различных типах обучения.

Источник: salt.mediasalt.ru

Комментарии (0)

Добавить комментарий

[related-news]

{related-news}

[/related-news]