神经调质门控实验
探索多巴胺、5-HT 等神经调质对学习的影响
💊
神经调质门控实验
探索多巴胺、5-HT 等神经调质对学习的影响
⏱️ 35 分钟📊 高级🧠 类脑 AI
实验概述
神经调质系统(多巴胺 DA、5-羟色胺 5-HT、去甲肾上腺素 NE、乙酰胆碱 ACh) 在大脑中实现学习速率的动态调节。本实验将带你实现 NCT 的神经调质门控机制, 通过指数门控公式动态调节突触可塑性,显著提升时序关联学习能力。 这是实现类脑决策和情感计算的关键技术。
运行实验
方法 1:直接运行脚本
# 克隆仓库
git clone https://github.com/wyg5208/nct.git
cd nct
# 安装依赖
pip install torch numpy scipy matplotlib
# 运行神经调质门控实验
python experiments/run_optimized_training_v3.py方法 2:使用 Python API
from nct_modules import NCTManager, NCTConfig
from nct_hybrid_learning import NeuromodulatorSystem
# 创建配置
config = NCTConfig(
n_heads=8,
d_model=768,
use_neuromodulation=True # 启用神经调质
)
# 初始化神经调质系统
neuromodulator = NeuromodulatorSystem(
da_weight=0.4, # 多巴胺权重(奖励)
ht_weight=0.3, # 5-HT 权重(惩罚)
ne_weight=0.2, # NE 权重(警觉)
ach_weight=0.1 # ACh 权重(注意力)
)
# 初始化并训练
manager = NCTManager(config, neuromodulator)
manager.train(data, epochs=30)
# 查看调质浓度变化
print(f"DA 变化:{neuromodulator.da_delta:.3f}")
print(f"有效学习率:{neuromodulator.effective_lr:.6f}")🧠 核心原理
💊 四种关键神经调质
多巴胺 (DA)
奖励预测误差,强化学习信号。当结果好于预期时释放,增强相关突触连接。
5-羟色胺 (5-HT)
惩罚敏感性,风险规避。调节冲动控制和延迟满足能力。
去甲肾上腺素 (NE)
警觉度调节,应对不确定性。在意外事件发生时大量释放。
乙酰胆碱 (ACh)
注意力聚焦,增强可塑性。促进学习和记忆形成。
📐 数学公式
η_effective = exp(Σ w_k · Δn_k)
其中 η_effective 是有效学习率,w_k 是调质权重,Δn_k 是调质浓度变化。
示例计算:
DA↑ (+0.5), 5-HT↓ (-0.3), NE↑ (+0.2), ACh↑ (+0.1)
η = exp(0.4×0.5 + 0.3×(-0.3) + 0.2×0.2 + 0.1×0.1)
η = exp(0.20) ≈ 1.22(学习率提升 22%)
实验结果
📈 性能提升
- 时序关联学习:+89%
- 效应量 (Cohen's d):1.41
- 收敛速度:快 2.3 倍
- 最终准确率:+5.7%
🎯 学习目标
- ✅ 理解神经调质功能
- ✅ 掌握门控机制实现
- ✅ 学会调节调质权重
- ✅ 能够分析实验结果
🌐 应用场景
🤖
强化学习
奖励 shaping、策略优化
❤️
情感计算
情绪建模、共情 AI
🎮
游戏 AI
NPC 行为调节、自适应难度