经过几十年的努力,在精神活性物质的奖赏效应及规律性用药的神经生物学机制方面已经取得了一系列重要进展,近年来也开始了强迫性用药机制的研究。
药物成瘾的核心特征是强迫性用药觅药,了解强迫性用药觅药的机制将能够更准确地认识药物成瘾的神经生物学基础。
(一)精神依赖相关的神经核团及神经环路
精神活性物质所致的精神依赖涉及众多核团和脑区,共同组成了皮质-纹状体-丘脑环路(彩图3-3),其中奖赏环路、学习记忆相关环路等发挥了重要作用。
三、精神依赖的神经生物学基础
图3-3 药物成瘾相关的皮质-纹状体-丘脑环路
红色箭头:多巴胺能投射;蓝色箭头:GABA能投射;黑色箭头:谷氨酸能投射
1.中脑边缘奖赏环路(reward circuit)
精神活性物质之所以能够引起精神依赖,与它们具有的特殊精神活性作用密切相关,包括愉悦、兴奋、增加觉醒程度、提升情绪和运动性、增加探索行为,甚至致幻等,其中最重要的是奖赏。
奖赏有两个主要功能,一个是激活行为,立即改变行为的方向和活跃程度;
另一个功能是强化作用,通过学习和记忆过程,改变未来的行为。
脑内奖赏系统主要由中脑边缘多巴胺系统构成。
多巴胺能神经元胞体位于VTA,神经纤维投射至NAc、PFC、海马、终纹床核、隔核、嗅结节和杏仁核。
其中VTA-NAc环路被认为是编码成瘾性药物急性奖赏效应的主要神经环路,与药物引起的奖赏效应密切相关。
此外,该环路中的VTA还受到PFC、杏仁核、海马的谷氨酸能投射和NAc的GABA能投射的调节;NAc除接受来自VTA的多巴胺能神经投射外,还受到来自PFC、杏仁核、海马的谷氨酸能投射的调节。
NAc是腹侧纹状体的主要组分,也是信息汇聚和整合的关键核团;NAc又分为壳区(shell)和核区(core)。壳区主要介导药物的奖赏效应,而核区主要介导条件性强化。
几乎所有的成瘾性物质都能直接或间接地提高NAc细胞外的多巴胺浓度,NAc编码个体获得欣快感(奖赏),并产生再次体验这种欣快感的愿望(动机)。
因此,VTA-NAc的多巴胺能奖赏环路是成瘾启动的共同通路。
用药初期,精神活性物质激活了中脑边缘多巴胺系统的功能,使NAc区多巴胺水平明显增高,从而产生欣快感;
长期用药后,导致中脑边缘多巴胺系统内相关核团或神经元突触发生持续的适应性改变。
虽然药物奖赏效应会随着用药时间的延长而逐渐减弱(奖赏耐受),但对药物相关线索却会产生敏化,这是产生渴求、导致复吸的主要因素。
同时多巴胺的作用变得更为广泛,从单纯的产生欣快感,转为凸显新异信号的意义、预测奖赏因素是否来临、产生驱动力(动机)、促进关联性学习等。
2.学习记忆相关环路
药物成瘾是由异常学习所建立的一种顽固的刺激-反应习惯,学习记忆相关的神经环路已被证明在成瘾行为的形成和保持中发挥重要作用。
研究表明,参与正常习惯学习和记忆的背侧纹状体(dorsal striatum,dStr)在强迫性用药觅药行为中可能发挥着特殊的作用。
规律性用药向强迫性用药转化的行为学基础是目的性行为向习惯性行为转变,而其神经生物学结构基础则是NAc向dStr功能的迁移。
dStr又可分为背外侧纹状体(dorsolateral striatum,dlStr)和背内侧纹状体(dorsomedial striatum,dmStr)两个亚区。
dmStr接受PFC投射形成的环路(其功能与NAc核区类似),主要参与行为-结果偶联学习,影响目的性行为,与规律性用药相关;感觉运动皮质与dlStr相联系,主要参与刺激-反应偶联学习,影响习惯性行为,可能与强迫性用药相关。大鼠可卡因自身给药模型建立初期,NAc壳部与核部的多巴胺释放量显著增加,干预NAc功能影响用药及觅药行为;而随着用药时间的延长,dStr替代NAc而主导对成瘾行为的调控。
经历45天可卡因自身给药训练的大鼠dlStr(而非NAc)内的DA释放量显著增加;失活dlStr能够恢复目标导向的可卡因觅药行为,但却抑制强迫性觅药行为。另外,利用正电子发射断层扫描技术(positron emission tomography,PET)发现,仅经历5天可卡因自身给药训练的恒河猴脑内葡萄糖利用率改变只局限于NAc,但经过100天的用药之后,这些改变已扩展到尾壳核(相当于啮齿类动物的dStr)的大部分区域;
临床研究也发现可卡因成瘾者dStr(而非腹侧纹状体)的多巴胺功能增强与线索诱发的渴求呈正相关。
因此,纹状体腹侧、背侧功能之间的转变是强迫性用药觅药行为产生的重要原因之一。这个转换过程受到来自前额叶不同脑区谷氨酸能的调控。
在规律性用药向强迫性用药发展的过程中,NAc和dStr的作用不是孤立存在的,而是通过纹状体-黑质-纹状体(striato-nigro-striatal,SNS)螺旋环路形成功能连接,NAc-dStr间的级联式连接可能参与了强迫性用药觅药行为的发展。
另外,作为情绪记忆关键核团,杏仁核也在成瘾行为中发挥重要作用,中央杏仁核主要参与强迫性觅药行为,基底外侧杏仁核在药物相关的条件性线索关联性学习记忆及诱发的复吸中起关键作用;
而作为记忆中枢的海马在情景线索关联性学习记忆及诱发的复吸中起重要作用。
上述皮质下结构在成瘾和病理性学习记忆的形成过程中是非常重要的,虽然不是全部要素,但却是必不可少的前提条件。
对此最有力的生物学证据是线虫也能对精神活性物质成瘾,形成一些相对简单的记忆行为,而线虫是不具备复杂中枢脑区结构的。
因此,重视上述研究结果,充分考虑它们在成瘾干预中的价值和意义是十分必要的。
3.前额叶皮质(prefrontal cortex,PFC)对成瘾行为的广泛调控作用
PFC也是药物成瘾的关键脑区,参与药物成瘾的多方面,包括渴求、动机和决策等。
目前研究认为与强迫性用药觅药密切相关的主要是PFC的内侧前额叶皮质(media prefrontal cortex,mPFC)、眶额叶皮质(orbitofrontal cortex,OFC)和前扣带皮质(anterior cingulate cortex,ACC)等亚区。
药物成瘾者往往表现出对药物和药物相关刺激的注意偏向、决策障碍、冲动抑制功能缺陷等认知功能障碍,从而产生强迫性用药觅药行为。
其主要原因是PFC结构功能发生了改变。
PFC接受起源于VTA的多巴胺能投射和起源于海马、基底外侧杏仁核等谷氨酸能投射,又发出谷氨酸能纤维支配VTA、NAc、海马、基底外侧杏仁核等核团。
mPFC投射至NAc的谷氨酸能环路功能的适应性改变导致控制功能缺陷、对药物相关刺激敏化。
mPFC包括背内侧前额叶皮质(prelimbic cortex,PrL)和腹内侧前额叶皮质(infralimbic,IL),其中PrL主要投射至NAc核区,而IL主要投射至NAc壳区;PrL-NAc核区投射主要调控觅药动机,IL-NAc壳区投射主要调控觅药行为的表达。
长期、大量使用成瘾药物导致PrL到NAc投射功能的弱化,促使形成强迫性觅药行为。
OFC通过与基底外侧杏仁核和NAc之间的神经联系对事件进行预测,并通过对价值和期望的比较来引导决策;
OFC受损之后会导致对反应-结果的判断错误,引起强迫反应的出现。长期用药导致的OFC功能下调使得成瘾者决策障碍,引起强迫性用药觅药行为。
另外,损毁ACC会破坏注意的选择以及辨别不同的条件信号的能力,这些能力的丧失导致无法提供及时、准确的信息以便启动行为抑制机制。
总之,长期用药引起的PFC认知功能障碍是导致强迫性用药觅药的另一个重要原因。另外
PFC也通过增强刺激的价值凸显和动机意义而参与药物成瘾行为。
4.与复吸相关的神经环路
对药物成瘾的机体即使长期戒断后,药物相关线索和环境、小剂量药物引燃以及应激均可诱发复吸,这也是药物成瘾治疗的难点。
经过大量研究,Kalivas提出了复吸的神经环路(彩图3-4)。从VTA到基底外侧杏仁核、再到PFC的投射是药物相关线索诱发复吸的通路;
从扩展的杏仁核(包括中央杏仁核、终纹床核和NAc壳区)到VTA、再到PFC的投射是应激诱发复吸的通路;
而从PFC到NAc核区、再到腹侧苍白球的投射则是应激、药物相关线索或药物本身诱发复吸的共同通路。
相对于多巴胺,谷氨酸系统在复吸中占主导地位。
图3-4 复吸的神经环路
红色:药物、线索或应激诱发复吸的共同通路;
绿色:线索诱发复吸的通路
蓝色:应激诱发复吸的通路
(二)精神依赖的相关神经递质系统
神经递质是实现神经环路功能的物质基础。根据现有的研究结果,几乎所有已知的中枢神经递质都不同程度地参与药物成瘾,
其中研究最多、也是最重要的是多巴胺和谷氨酸神经递质系统。
1.多巴胺系统(dopamine system)
VTA-NAc的多巴胺能神经通路介导的奖赏效应是成瘾启动的第一步,几乎所有的精神活性物质都能直接或间接激活此多巴胺能神经通路,但它们的初始作用机制并不相同。
阿片类药物通过激活VTA内的GABA能中间神经元上的μ阿片受体而抑制GABA能神经元的活动,从而解除GABA能神经元对VTA多巴胺能神经元的抑制,使其在投射靶区NAc释放的多巴胺量增加,激活NAc的GABA能投射神经元,而实现奖赏效应的编码;
可卡因和苯丙胺类兴奋剂作用于NAc内的多巴胺能神经末梢,可卡因通过抑制质膜多巴胺转运体阻断多巴胺重摄取;
苯丙胺类兴奋剂既能抑制质膜多巴胺转运体阻断多巴胺重摄取,也能通过逆转囊泡单胺转运体2和质膜单胺转运体功能、促进多巴胺逆转运增加多巴胺释放而增加细胞外多巴胺含量,从而上调VTA-NAc的多巴胺神能经通路功能;
大麻可通过激活GABA能神经元和谷氨酸能神经元上的CB1受体而增加VTA多巴胺能神经元的放电和NAc内的多巴胺浓度;
尼古丁可激活位于VTA多巴胺能神经元的α4β2烟碱型乙酰胆碱受体,从而增加VTA多巴胺能神经元末梢在NAc内的多巴胺释放;
乙醇可通过作用于GABAA受体和NMDA受体,以某种间接方式增加NAc的多巴胺释放。
早期认为,多巴胺是产生奖赏(欣快感)的物质基础,而近年来研究则发现,多巴胺还介导了奖赏预期误差和与奖赏相关的关联性学习。
Schultz等系统研究了VTA的多巴胺能神经元对奖赏刺激的反应。
他们在经典条件反射训练的恒河猴实验模型中研究发现,天然奖赏(如果汁、食物)刺激引起VTA脑区的多巴胺能神经元出现相位性(phasic)放电频率增加,而非天然奖赏性刺激不能引起上述多巴胺能神经元出现相位性放电频率增加,提示多巴胺能神经元能够据此区分奖赏刺激和非奖赏刺激;
进一步研究观察到,对不同天然奖赏刺激,上述多巴胺能神经元的放电样式没有显著差别,提示多巴胺能神经元不能区分天然奖赏物的性质。
此外,多巴胺能神经元还参与对奖赏的学习,表现为对奖赏刺激的反应可建立起巴甫洛夫条件反射。当把声音或灯光信号与原始奖赏物(果汁)反复配对后,单独的条件性刺激(声音或灯光信号)也可引起多巴胺能神经元相位性放电频率增加,表明多巴胺不仅对奖赏本身(果汁)、也对奖赏出现的预期(条件性刺激)产生反应。
这种对奖赏和与之配对的条件性刺激的反应,随配对训练次数的增加而逐渐改变。训练初期,只有原始奖赏能够引起多巴胺能神经元放电频率增加;训练中期,奖赏及条件性刺激都能引起多巴胺能神经元放电频率增加;训练完成后(条件性刺激与奖赏的联系已牢固建立),只有条件性刺激能够引起多巴胺能神经元放电频率增加。
这表明通过关联性学习,多巴胺能神经元对原始奖赏的反应能够转移到与奖赏有关的条件性刺激上。当不给予条件性刺激,使实验动物不能预计可能会得到奖赏(奖赏未被预测)时,给予奖赏刺激能引起多巴胺能神经元放电频率增加;当给予条件性刺激,使实验动物能预计可能会得到奖赏(奖赏被预测)时,给予奖赏刺激(奖赏与预期一致),条件性刺激能使多巴胺能神经元放电频率增加,而奖赏本身不改变多巴胺能神经元放电频率;当给予条件性刺激、而未出现奖赏时(奖赏预测错误),条件性刺激引起放电频率增加,而未出现的奖赏导致放电频率减少。这些结果说明,多巴胺能神经元并非对所有奖赏都起反应,而只对实际奖赏与预期奖赏之间的差别起反应,即只对奖赏预期误差起反应
。当奖赏比预期更好或在期望之外出现时,多巴胺能神经元为正反应,而当奖赏比预期更差或在期望时间不出现时,多巴胺能神经元出现负反应。
精神活性物质使突触间隙多巴胺水平过度而持续的升高,使大脑误以为药物奖赏比预期的好,使得药物的价值凸显,诱发觅药用药行为。
由于药物诱发的多巴胺释放量比食物等天然奖赏物诱发的多巴胺释放量更高更持久,一方面使药物相关刺激-奖赏之间的关联性学习更强烈,另一方面也使天然奖赏目标贬值。
另外,多巴胺也介导了行为-结果关联性学习和习惯学习(刺激-反应关联性学习)。
细胞外增加的多巴胺通过激活多巴胺受体发挥作用。多巴胺受体分D1~D5等五种亚型。D1和D5亚型与Gs蛋白偶联,统称为D1样多巴胺受体,主要分布在突触后膜;D2、D3和D4亚型与Gi/o蛋白偶联,统称为D2样受体,在突触前膜和后膜都有分布。D1样受体和D2样受体介导的功能及其在成瘾不同阶段所起的作用均不同。D1样受体主要介导成瘾药物的奖赏和动机敏化,在用药初期的中枢神经系统代偿性适应中发挥主导作用;而D2样受体可能更多地参与条件性强化和强迫性觅药行为,在用药后期的中枢神经系统代偿性适应中发挥主导作用。在药物成瘾患者和动物模型中均发现纹状体D2/D3受体密度降低;用光遗传学技术抑制小鼠NAc内D2受体阳性的GABA能中等棘状神经元,小鼠则表现出强迫性觅药行为;高冲动性大鼠(D2受体密度低)更易形成强迫性觅药,但也有研究显示高冲动性大鼠在二级强化训练中延缓形成觅药习惯。这些研究说明D2受体及其神经元所在的通路在成瘾发展阶段的后期较D1受体发挥更加重要的功能,D2受体介导的间接通路主导对强迫性觅药行为的调控,但是确切的调节方式尚不清楚。另外,D2受体密度可能也是成瘾易感性的生物学标志。高冲动性大鼠在可卡因自身给药训练过程中具有更高的用药频率,具有高冲动性人格的人更倾向于滥用成瘾性药物。而高冲动性背后的分子基础可能是D2受体密度降低:高冲动性大鼠NAc和VTA内的D2受体mRNA较低冲动性大鼠显著减少,高冲动性大鼠腹侧纹状体内的D2/D3受体密度更低。
2.谷氨酸系统(glutamate system)
如上所述,多巴胺系统主要介导了药物的奖赏强化,在奖赏相关的关联性学习中发挥重要作用,而对长时程关联性记忆影响较小。
谷氨酸系统则不然,虽然谷氨酸也参与奖赏相关的关联性学习,但它与长时程关联性记忆关系最为密切,起关键作用。
因此,在成瘾启动和形成过程中,多巴胺系统的参与是必需的
;而在成瘾维持和复吸中,谷氨酸系统的参与是不可或缺的。
大量证据表明,药物引起的欣快感及成瘾的启动需要NAc内多巴胺的释放,而随着反复用药则引起PFC及其投射到NAc等核团的谷氨酸能神经元参与,因此有学者提出从偶然性用药发展为规律性用药,从规律性用药模式下的复吸发展到强迫性用药模式下的复吸经历了从中脑边缘皮质多巴胺系统到前额叶皮质谷氨酸系统、再到皮质纹状体谷氨酸系统占主导地位的过渡。
在药物成瘾过程中,谷氨酸直接或间接调节多巴胺系统功能;同样,多巴胺也能通过中脑边缘皮质投射而影响谷氨酸功能。
VTA的多巴胺能神经元活性受来自PFC、杏仁核、海马等谷氨酸能神经投射的支配。
一方面,传入VTA的谷氨酸能神经纤维支配多巴胺能神经元胞体,提高了多巴胺能神经元胞体的兴奋性,促进了NAc内多巴胺的释放;
另一方面,传入NAc的谷氨酸能神经纤维支配多巴胺能神经元的末梢,通过突触前机制也促进了NAc内多巴胺的释放。
NAc内的GABA能中等棘状神经元的树突棘同时与多巴胺能末梢和谷氨酸能末梢形成突触连接,其活动受到这两类神经递质的共同调节。
因此,谷氨酸也能调节依赖于中脑边缘多巴胺系统的行为敏化。
行为敏化的形成需要VTA谷氨酸释放的短暂增加,从而激活VTA的多巴胺能神经元,使其放电增强,进而引起该环路多巴胺释放的增加;
VTA内微注射谷氨酸受体阻断剂能阻断精神活性物质引起的敏化
。与NAc类似,背侧纹状体也同时接受多巴胺能投射和谷氨酸能投射而控制其功能,因此,谷氨酸系统也参与强迫性用药觅药行为的调控。
总体来说,药物使用初期谷氨酸系统尚未发生适应性改变,随着用药时间延长和剂量增大,PFC对NAc的谷氨酸能支配减弱,使得皮质纹状体功能增强,产生强迫性用药和强迫性觅药。
在觅药-用药范式训练中,大鼠NAc核区微注射AMPA受体/KA受体阻断剂后其觅药行为显著降低,提示NAc的谷氨酸系统参与调控用药初期的觅药行为。而经历45天可卡因自身给药训练的大鼠,dlStr(而非NAc)内微注射AMPA受体/KA受体阻断剂显著减少大鼠的觅药行为,提示背侧纹状体的谷氨酸系统可能通过更为稳定的神经适应性改变而参与强迫性觅药行为。
由于长期戒断后复吸的根本原因是异常顽固的成瘾记忆,而谷氨酸及其受体是介导长时程记忆的关键,因此对复吸具有决定性作用的是谷氨酸而非多巴胺。
可卡因自身给药大鼠NAc内微注射AMPA可重建觅药行为(即复吸);有学者认为AMPA诱导的觅药行为重建可能与增加局部多巴胺释放有关,但是使用多巴胺受体阻断剂并不能阻断AMPA的重建效应,表明导致复吸的原因是NAc谷氨酸系统的激活。
另外,电刺激可卡因自身给药大鼠谷氨酸能纤维丰富的海马腹侧下脚,通过图3-4所述的“复吸回路”重建觅药行为,而刺激多巴胺能纤维丰富的中间前脑束则无效。
PFC至NAc的谷氨酸能投射被认为是药物相关线索、小剂量药物和应激诱发的复吸的公共环路,其谷氨酸系统稳态的削弱通过影响神经可塑性而产生持久的行为改变,导致复吸。
长期用药使负责维持谷氨酸基础水平的谷氨酸-半胱氨酸交换体密度减少,NAc核区谷氨酸基础水平降低;
降低的基础谷氨酸水平使得代谢型谷氨酸受体mGluR2/3介导的突触前负反馈调节能力减弱。在消退训练期连续给予N-乙酰半胱氨酸,通过促进谷氨酸-半胱氨酸交换而升高了细胞外基础谷氨酸水平,从而恢复了突触前mGluR2/3调节能力,防止了线索或药物点燃时诱发的谷氨酸水平的急剧升高,从而抑制了觅药行为的重建。
更为重要的是,消退期连续给予N-乙酰半胱氨酸能够逆转长期用药诱导的NAc核区突触可塑性改变,所以即使在停药20多天后仍能抑制线索或药物诱发的复吸。其他能够恢复谷氨酸稳态的手段,如阻断突触后NMDA受体和mGluR5、提高谷氨酸转运体1表达也都能够防止复吸。谷氨酸及其受体是突触传递可塑性的基础,在成瘾的长时程记忆中发挥重要作用,将在下一部分详细叙述。
3.其他神经递质系统
除了多巴胺和谷氨酸外,内源性阿片肽、GABA、5-羟色胺等神经递质通过与多巴胺、谷氨酸系统相互作用,参与了药物成瘾过程。
例如,内源性阿片肽和5-羟色胺调节多巴胺系统功能,GABA不仅调节多巴胺系统,还调节谷氨酸系统功能。
GABA是脑内最主要的抑制性神经递质,与兴奋性的神经递质共同协调大脑的正常功能。
GABA受体分为GABAA、GABAB及GABAC三种亚型,其中GABAA和GABAC属于递质门控离子通道,GABAB受体为G蛋白偶联受体。VTA的多巴胺能神经元的活动受到GABA能神经元的紧张性抑制,GABA能神经元上存在μ阿片受体,阿片类物质激动μ阿片受体后可抑制GABA能神经元的功能,减少GABA的释放,从而解除对多巴胺能神经元的紧张性抑制,使释放到NAc区的多巴胺含量增加;酒精可作用于GABAA受体和NMDA受体,从而以某种间接的方式增加多巴胺能神经元活性。GABA能神经元对VTA多巴胺能神经元的调节由GABAA受体和GABAB受体介导,激活GABA受体能够抑制精神活性物质的奖赏和强化效应。海马、杏仁核和PFC的GABA神经递质系统也通过影响谷氨酸能锥体神经元的功能而参与精神活性物质相关的情景和线索关联记忆及其所致的认知功能障碍。另外,作为奖赏与动机核心的NAc以及强迫性用药行为关键核团的dStr,它们本身的输出神经元就是GABA能神经元。
因此,GABA系统通过调节中脑边缘皮质通路和皮质纹状体通路功能而参与药物成瘾。
内源性阿片肽包括脑啡肽家族、内啡肽家族、强啡肽家族和后来又分离出的许多新的阿片肽,其中最重要的成员包括β-内啡肽、脑啡肽及强啡肽,其作用的受体分别是μ、δ和κ阿片受体。内源性阿片肽及其受体在中枢神经系统尤其是奖赏、动机环路如VTANAc广泛分布。
如前所述,外源性阿片类物质能够激活分布于VTA的GABA能中间神经元上的μ阿片受体,解除GABA能神经元对多巴胺能神经元的抑制,增加NAc内多巴胺的释放;而NAc内多巴胺能神经元轴突末梢也存在κ阿片受体,激活κ阿片受体则抑制多巴胺的释放。因此,μ阿片受体和κ阿片受体共同调节NAc内多巴胺的释放
。同时,外源性阿片类物质还能通过作用于NAc的中等棘状神经元上的μ阿片受体和δ阿片受体,而调节受多巴胺能神经元支配的棘状神经元的功能。许多非阿片类精神活性物质也能够作用于内源性阿片肽系统。临床前研究显示酒精、可卡因、苯丙胺类兴奋剂能够增加大鼠NAc的内啡肽水平,参与调节NAc细胞外多巴胺水平。
另外,苯丙胺急性处理能够调节纹状体内阿片受体mRNA表达;长期饮酒会增加μ阿片受体和δ阿片受体的密度。因此,内源性阿片肽系统通过影响NAc内多巴胺的释放,参与调节多种成瘾性物质的奖赏效应。内源性阿片肽系统除了介导奖赏效应外,还介导了停药后出现的戒断综合征,维持内源性阿片肽系统功能稳定是药物成瘾的治疗策略之一。