文档中心

神经调质门控实验

探索多巴胺、5-HT 等神经调质对学习的影响

💊

神经调质门控实验

探索多巴胺、5-HT 等神经调质对学习的影响

⏱️ 35 分钟📊 高级🧠 类脑 AI

实验概述

神经调质系统(多巴胺 DA、5-羟色胺 5-HT、去甲肾上腺素 NE、乙酰胆碱 ACh) 在大脑中实现学习速率的动态调节。本实验将带你实现 NCT 的神经调质门控机制, 通过指数门控公式动态调节突触可塑性,显著提升时序关联学习能力。 这是实现类脑决策和情感计算的关键技术。

运行实验

方法 1:直接运行脚本

# 克隆仓库
git clone https://github.com/wyg5208/nct.git
cd nct

# 安装依赖
pip install torch numpy scipy matplotlib

# 运行神经调质门控实验
python experiments/run_optimized_training_v3.py

方法 2:使用 Python API

from nct_modules import NCTManager, NCTConfig
from nct_hybrid_learning import NeuromodulatorSystem

# 创建配置
config = NCTConfig(
    n_heads=8,
    d_model=768,
    use_neuromodulation=True  # 启用神经调质
)

# 初始化神经调质系统
neuromodulator = NeuromodulatorSystem(
    da_weight=0.4,   # 多巴胺权重(奖励)
    ht_weight=0.3,   # 5-HT 权重(惩罚)
    ne_weight=0.2,   # NE 权重(警觉)
    ach_weight=0.1   # ACh 权重(注意力)
)

# 初始化并训练
manager = NCTManager(config, neuromodulator)
manager.train(data, epochs=30)

# 查看调质浓度变化
print(f"DA 变化:{neuromodulator.da_delta:.3f}")
print(f"有效学习率:{neuromodulator.effective_lr:.6f}")

🧠 核心原理

💊 四种关键神经调质

多巴胺 (DA)

奖励预测误差,强化学习信号。当结果好于预期时释放,增强相关突触连接。

5-羟色胺 (5-HT)

惩罚敏感性,风险规避。调节冲动控制和延迟满足能力。

去甲肾上腺素 (NE)

警觉度调节,应对不确定性。在意外事件发生时大量释放。

乙酰胆碱 (ACh)

注意力聚焦,增强可塑性。促进学习和记忆形成。

📐 数学公式

η_effective = exp(Σ w_k · Δn_k)

其中 η_effective 是有效学习率,w_k 是调质权重,Δn_k 是调质浓度变化。

示例计算:
DA↑ (+0.5), 5-HT↓ (-0.3), NE↑ (+0.2), ACh↑ (+0.1)
η = exp(0.4×0.5 + 0.3×(-0.3) + 0.2×0.2 + 0.1×0.1)
η = exp(0.20) ≈ 1.22(学习率提升 22%)

实验结果

📈 性能提升

  • 时序关联学习:+89%
  • 效应量 (Cohen's d):1.41
  • 收敛速度:快 2.3 倍
  • 最终准确率:+5.7%

🎯 学习目标

  • ✅ 理解神经调质功能
  • ✅ 掌握门控机制实现
  • ✅ 学会调节调质权重
  • ✅ 能够分析实验结果

🌐 应用场景

🤖

强化学习

奖励 shaping、策略优化

❤️

情感计算

情绪建模、共情 AI

🎮

游戏 AI

NPC 行为调节、自适应难度