💊

神经调质门控实验

探索多巴胺、5-HT 等神经调质对学习的影响

⏱️ 35 分钟📊 高级🧠 类脑 AI

实验概述

神经调质系统（多巴胺 DA、5-羟色胺 5-HT、去甲肾上腺素 NE、乙酰胆碱 ACh）在大脑中实现学习速率的动态调节。本实验将带你实现 NCT 的神经调质门控机制，通过指数门控公式动态调节突触可塑性，显著提升时序关联学习能力。这是实现类脑决策和情感计算的关键技术。

运行实验

方法 1：直接运行脚本

# 克隆仓库
git clone https://github.com/wyg5208/nct.git
cd nct

# 安装依赖
pip install torch numpy scipy matplotlib

# 运行神经调质门控实验
python experiments/run_optimized_training_v3.py

方法 2：使用 Python API

from nct_modules import NCTManager, NCTConfig
from nct_hybrid_learning import NeuromodulatorSystem

# 创建配置
config = NCTConfig(
    n_heads=8,
    d_model=768,
    use_neuromodulation=True  # 启用神经调质
)

# 初始化神经调质系统
neuromodulator = NeuromodulatorSystem(
    da_weight=0.4,   # 多巴胺权重（奖励）
    ht_weight=0.3,   # 5-HT 权重（惩罚）
    ne_weight=0.2,   # NE 权重（警觉）
    ach_weight=0.1   # ACh 权重（注意力）
)

# 初始化并训练
manager = NCTManager(config, neuromodulator)
manager.train(data, epochs=30)

# 查看调质浓度变化
print(f"DA 变化：{neuromodulator.da_delta:.3f}")
print(f"有效学习率：{neuromodulator.effective_lr:.6f}")

🧠 核心原理

💊 四种关键神经调质

多巴胺 (DA)

奖励预测误差，强化学习信号。当结果好于预期时释放，增强相关突触连接。

5-羟色胺 (5-HT)

惩罚敏感性，风险规避。调节冲动控制和延迟满足能力。

去甲肾上腺素 (NE)

警觉度调节，应对不确定性。在意外事件发生时大量释放。

乙酰胆碱 (ACh)

注意力聚焦，增强可塑性。促进学习和记忆形成。

📐 数学公式

η_effective = exp(Σ w_k · Δn_k)

其中 η_effective 是有效学习率，w_k 是调质权重，Δn_k 是调质浓度变化。

示例计算：
DA↑ (+0.5), 5-HT↓ (-0.3), NE↑ (+0.2), ACh↑ (+0.1)
η = exp(0.4×0.5 + 0.3×(-0.3) + 0.2×0.2 + 0.1×0.1)
η = exp(0.20) ≈ 1.22（学习率提升 22%）

实验结果

📈 性能提升

时序关联学习:+89%
效应量 (Cohen's d):1.41
收敛速度:快 2.3 倍
最终准确率:+5.7%

🎯 学习目标

✅ 理解神经调质功能
✅ 掌握门控机制实现
✅ 学会调节调质权重
✅ 能够分析实验结果

🌐 应用场景

🤖

强化学习

奖励 shaping、策略优化

❤️

情感计算

情绪建模、共情 AI

🎮

游戏 AI

NPC 行为调节、自适应难度

← 返回实验列表猫识别实战 →