电源管理入门-1关机重启详解

原创 thatway OS与AUTOSAR研究 2023-09-19 07:25 发表于北京

当我们接触**电源管理**的时候，**最简单**的流程就是**关机重启**，但是仔细分析其涉及的所有源代码就会发现，关机重启虽然简单，但是“**麻雀虽小，五脏俱全**”，涉及到的软件模块非常的多，涉及的流程：Linux应用（busybox）-》Linux内核-》BL31-》SCP-》PMIC/CRU等硬件。所以是一个入门学习，特别是还没接触过Linux内核代码的好机会，下面进入代码的海洋遨游，**超级干货**！ ### **1. 关机重启软件流程框图** 在Linux系统上的处理分为**用户态**空间、**内核**空间、**ATF**、**SCP**四个阶段（ATF是ARM独有的，SCP在复杂SoC上才有应用）来处理：

1.1 用户层利用reboot、poweroff等命令进行关机，在应用层会执行：

发送SIGTERM给所有进程，让进程正常退出
发送SIGKILL给所有进程，将其杀掉，并等待一段时间
调用reboot系统调用让系统关机/重启

1.2 Linux 内核层reboot系统调用会进入内核，具体流程为：

reboot系统调用根据参数找到kernel_power_off/reset
向关心reboot事件的进程发送消息--blocking_notifier_call_chain
内核Kobject状态发生改变不通知用户空间--usermodehelper_disable
关闭所有的设备--device_shutdown
禁止CPU热插拔，设置当前CPU为第一个在线CPU，把新任务转移到当前CPU上--migrate_to_reboot_cpu
关闭syscore设备--syscore_shutdown
提示用户空间系统将要关闭--pr_emerg
禁止cpu硬件中断--local_irq_disable
其他cpu处于非工作状态--smp_send_stop
调用psci接口，执行smc指令，关闭arm cpu--pmm_power_off/rese->psci_sys_poweroff/reset->invoke_psci_fn->arm_smccc_smc->SMCCC SMCCC_SMC

1.3 ATF 层执行SMC指令后会触发异常，进入ATF的BL31中继续执行：

进入异常向量处理的入口sync_exception_aarch64
跳转执行rt_svc_desc_t结构体保存的服务std_svc_smc_handler
执行psci相关处理。通用psci的处理函数psci_system_off和psci_system_reset，通过调用平台提供的system_off、 system_reset接口将psci消息转化为scmi消息发给SCP模块，实现最终的关机、重启。如果如果没有SCP固件的系统，会在ATF里面操作硬件寄存器进行关机重启处理。

1.4 SCP 层

ATF通过scim消息发送给MHU硬件并产生中断，SCP接受到中断后内部依次进行处理的模块为：mhu-->transport-->scmi-->scmi_system_power-->power_domain-->ppu/system_power-->i2c/cru，最后SCP固件通过控制PMIC/CRU的硬件寄存器实现对系统的关机重启设置。\

2. Busybox中的关机重启命令

执行关机重启的系统命令，例如shutdown/poweroff/halt/reboot/init命令进程及服务如果提前会被正确的中止，我们就说其是安全的退出。通常关机重启命令需要管理员权限执行，所在系统目录为/sbin/*，如下为shutdown命令：

命令格式  
\[root\@localhost \~]# shutdown \[选项] 时间 \[警告信息]  选项: 
-c：取消已经执行的 shutdown 命令；  
-h：关机；  
-r：重启；

init命令相关执行：

|  \[root\@localhost\~]#  init 0  
#关机，也就是调用系统的 0 级别  
\[root\@localhost \~】# init 6  
#重启，也就是调用系统的 6 级别

现在Linux里面这些命令基本都使用busybox实现的，代码参考：\ https://busybox.net/downloads/busybox启动的时候，会注册reboot的处理信号init\init.c中**init_main**函数在初始化的时候调用

   sigaddset(&G.delayed_sigset,  SIGUSR1); /* halt */
   sigaddset(&G.delayed_sigset, SIGTERM); /* reboot */
   sigaddset(&G.delayed_sigset, SIGUSR2); /* poweroff */

   /* Now run the looping stuff for the rest of forever */
     while (1) {
         /*  (Re)run the respawn/askfirst stuff */
         run_actions(RESPAWN |  ASKFIRST);

         /* Wait for any signal (typically it's SIGCHLD) */
         check_delayed_sigs(NULL); /* NULL timespec makes it wait */
         .....
     }

check_delayed_sigs（）函数会收到reboot的信号运行busybox reboot的时候，reboot —> halt_main，可知会执行 halt_main()函数，在init\halt.c中

static  const smallint signals[] = { SIGUSR1, SIGUSR2, SIGTERM  };
 #  define RB_HALT_SYSTEM  0xcdef0123
 #  define RB_ENABLE_CAD   0x89abcdef
 #  define RB_DISABLE_CAD  0
 #  define RB_POWER_OFF    0x4321fedc
 #  define RB_AUTOBOOT     0x01234567

 flags = getopt32(argv,  "d:+nfwi", &delay);

 if (!(flags & 4)) { /* no -f */
     rc = kill(pidlist[0],  signals[which]);
 }
 else{
     rc = reboot(magic[which]);
 }

这里可以看出来，分为两个流程：

当reboot命令没有加**-f**的时候，直接使用kill发送信号到busybox执行halt_reboot_pwoff函数
直接使用-f的话，直接使用reboot系统调用接口，通知内核，让内核执行重启操作，简单粗暴

如果1中发送kill命令的SIGTERM 信号后，在busybox的轮询处理函数中会接收信号进行处理，如下：

static  void check_delayed_sigs(struct timespec *ts)
 {
     int sig =  sigtimedwait(&G.delayed_sigset, /*  siginfo_t */ NULL, ts);
     if (sig <= 0)
         return;

     /*  The signal "sig" was caught */
 #if ENABLE_FEATURE_USE_INITTAB
     if (sig == SIGHUP)
         reload_inittab();
 #endif
     if (sig == SIGINT)
         run_actions(CTRLALTDEL);
     if (sig == SIGQUIT) {
         exec_restart_action();
         /* returns only if no restart action defined */
     }
     if ((1 << sig) & (0
 #ifdef SIGPWR
         | (1 << SIGPWR)
 #endif
         | (1 << SIGUSR1)
         | (1 << SIGUSR2)
         | (1 << SIGTERM)
     )) {
         halt_reboot_pwoff(sig);
     }
     /*  if (sig == SIGCHLD) do nothing */
 }

在busybox内部解析后会执行halt_reboot_pwoff（）函数

 #define  RB_AUTOBOOT        0x01234567
 #define RB_POWER_OFF       0x4321fedc

 static void halt_reboot_pwoff(int sig)
 {
         const char *m;
         unsigned rb;

          reset_sighandlers_and_unblock_sigs();
          run_shutdown_and_kill_processes();//进行关机通知其他进程处理

         m = "halt";
         rb = RB_HALT_SYSTEM;
         if (sig == SIGTERM) {
                 m = "reboot";
                 rb = RB_AUTOBOOT;
         } else if (sig == SIGUSR2) {
                 m =  "poweroff";
                 rb = RB_POWER_OFF;
         }
         message(L_CONSOLE,  "Requesting system %s", m);
         pause_and_low_level_reboot(rb);
 }

halt_reboot_pwoff（）分为三步：

发送SIGTERM给所有进程，让进程正常退出
发送SIGKILL给所有进程，将其杀掉
让系统重启

发送SIGTERM和SIGKILL信号给其他进程

static  void run_shutdown_and_kill_processes(void)
 {
         run_actions(SHUTDOWN);

         message(L_CONSOLE | L_LOG,  "The system is going down NOW!");

         /* Send signals to every  process _except_ pid 1 */
         kill(-1,  SIGTERM);
         message(L_CONSOLE, "Sent  SIG%s to all processes", "TERM");
         sync();
         sleep1();

         kill(-1,  SIGKILL);
         message(L_CONSOLE, "Sent  SIG%s to all processes", "KILL");
         sync();
         /*sleep1(); - callers take care  about making a pause */
 }

调用子进程进行reboot系统调用：

 static  void pause_and_low_level_reboot(unsigned magic)
 {
         pid_t pid;

         sleep1();
         pid = vfork();
         if (pid == 0) { /* child */
                 reboot(magic);
                 _exit(EXIT_SUCCESS);
         }

         waitpid(pid, NULL, 0);
         sleep1(); /* paranoia */
         _exit(EXIT_SUCCESS);
 }

reboot(magic);进行了系统调用。\

3. Linux内核中的处理\

内核中代码执行流程图：\ 关机主要过程总结：

reboot系统调用根据参数找到kernel_power_off/reset
向关心reboot事件的进程发送消息--blocking_notifier_call_chain
内核Kobject状态发生改变不通知用户空间--usermodehelper_disable
关闭所有的设备--device_shutdown
禁止CPU热插拔，设置当前CPU为第一个在线CPU，把新任务转移到当前CPU上--migrate_to_reboot_cpu
关闭syscore设备--syscore_shutdown
提示用户空间系统将要关闭--pr_emerg
禁止cpu硬件中断--local_irq_disable
其他cpu处于非工作状态--smp_send_stop
调用psci接口，执行smc指令，关闭arm cpu--pmm_power_off/rese->psci_sys_poweroff/reset->invoke_psci_fn->arm_smccc_smc->SMCCC SMCCC_SMC
3.1 系统调用实现****在kernel/reboot.c中声明了rboot系统调用的实现：

SYSCALL_DEFINE4(reboot, int, magic1, int, magic2, unsigned int, cmd,void __user *, arg)
 {
     ......
     switch (cmd) {
         case LINUX_REBOOT_CMD_POWER_OFF:
                 kernel_power_off();
                 do_exit(0);
                 break;

其中cmd就是系统调用传进来的magic值，其他的值定义为：

#define        LINUX_REBOOT_CMD_RESTART   0x01234567
 #define         LINUX_REBOOT_CMD_HALT     0xCDEF0123
 #define        LINUX_REBOOT_CMD_CAD_ON    0x89ABCDEF
 #define         LINUX_REBOOT_CMD_CAD_OFF  0x00000000
 #define        LINUX_REBOOT_CMD_POWER_OFF 0x4321FEDC
 #define         LINUX_REBOOT_CMD_RESTART2 0xA1B2C3D4
 #define       LINUX_REBOOT_CMD_SW_SUSPEND 0xD000FCE2
 #define         LINUX_REBOOT_CMD_KEXEC    0x45584543

reboot系统调用实现过程：

判断调用者的用户权限，如果不是超级用户（superuser），则直接返回错误（这也是我们再用户空间执行reboot、halt、poweroff等命令时，必须是root用户的原因）；
判断传入的magic number是否匹配，如果不匹配，直接返回错误。这样就可以尽可能的防止误动作发生；
调用reboot_pid_ns接口，检查是否需要由该接口处理reboot请求。这是一个有关pid namespaces的新特性，也是Linux内核重要的知识点；
如果是POWER_OFF命令，且没有注册power off的machine处理函数（pmm_power_off），把该命令转换为HALT命令；
根据具体的cmd命令，执行具体的处理，包括，如果是RESTART或者RESTART2命令，调用kernel_restart。如果是CAD_ON或CAD_OFF命令，更新C_A_D的值，表示是否允许通过Ctrl+Alt+Del组合键重启系统。如果是HALT命令，调用kernel_halt。如果是POWER_OFF命令，调用kernel_power_off。如果是KEXEC命令，调用kernel_kexec接口。如果是SW_SUSPEND，调用hibernate接口；
返回上述的处理结果，系统调用结束。

3.2 内核关机函数分析

****这里我们以关机poweroff命令为例，进行代码分析，重启流程相似。

void  kernel_power_off(void)
 {
     kernel_shutdown_prepare(SYSTEM_POWER_OFF);
       if (pmm_power_off_prepare)
               pmm_power_off_prepare();//PM相关的power off prepare函数
         migrate_to_reboot_cpu();//将当前的进程（task）移到一个CPU上
         syscore_shutdown(); //syscore的关闭流程,将系统核心器件关闭（例如中断等）
         pr_emerg("Power  down\n");
          kmsg_dump(KMSG_DUMP_POWEROFF);//向这个世界发出最后的声音（打印日志）
         machine_power_off();//soc基本的关闭
 }

1）调用kernel_xxx_prepare函数，进行restart/halt/power_off前的准备工作，包括，调用blocking_notifier_call_chain接口，向关心reboot事件的进程，发送SYS_RESTART、 SYS_HALT或者SYS_POWER_OFF事件。对RESTART来说，还好将cmd参数一并发送出去。将系统状态设置为相应的状态（SYS_RESTART、SYS_HALT或SYS_POWER_OFF）。调用usermodehelper_disable接口，禁止User mode helper。调用device_shutdown，关闭所有的设备（具体内容会在下一节讲述）；

2）如果是power_off，且存在PM相关的power off prepare函数（pm_power_off_prepare），则调用该回调函数；

3）调用migrate_to_reboot_cpu接口，将当前的进程（task）移到一个CPU上；注2：对于多CPU的机器，无论哪个CPU触发了当前的系统调用，代码都可以运行在任意的CPU上。这个接口将代码分派到一个特定的CPU上，并禁止调度器分派代码到其它CPU上。也就是说，这个接口被执行后，只有一个CPU在运行，用于完成后续的reboot动作。

4）调用syscore_shutdown接口，将系统核心器件关闭（例如中断等）；

5）调用printk以及kmsg_dump，向这个世界发出最后的声音（打印日志）；

6）最后，由machine-core的代码，接管后续的处理。

3.3 关闭所有设备处理

****kernel_shutdown_prepare-->device_shutdown会关闭所有设备。设备关闭的过程是遍历全局变量devices_kset里面的所有设备，并从链表中删除，执行相关的shuntdown回调函数。函数处理过程如下：

void  device_shutdown(void)
 {
         struct device *dev, *parent;

         wait_for_device_probe();
         device_block_probing();

          spin_lock(&devices_kset->list_lock);
         while  (!list_empty(&devices_kset->list)) {
                 dev =  list_entry(devices_kset->list.prev, struct device,
                                  kobj.entry);

         parent =  get_device(dev->parent);
         get_device(dev);

         list_del_init(&dev->kobj.entry);
           spin_unlock(&devices_kset->list_lock);

     /* hold lock to avoid  race with probe/release */
          if (parent)
                device_lock(parent);
          device_lock(dev);

           /* Don't allow any more  runtime suspends */
            pm_runtime_get_noresume(dev);
            pm_runtime_barrier(dev);

            if (dev->class  && dev->class->shutdown_pre) {
            if  (initcall_debug)
                     dev_info(dev,  "shutdown_pre\n");
              dev->class->shutdown_pre(dev);
            }
                 if (dev->bus  && dev->bus->shutdown) {
                   if  (initcall_debug)
                         dev_info(dev, "shutdown\n");
                         dev->bus->shutdown(dev);
                 } else if  (dev->driver && dev->driver->shutdown) {
                     if  (initcall_debug)
                          dev_info(dev, "shutdown\n");
                         dev->driver->shutdown(dev);
                 }

              device_unlock(dev);
                if (parent)
                      device_unlock(parent);

              put_device(dev);
              put_device(parent);

              spin_lock(&devices_kset->list_lock);
         }
          spin_unlock(&devices_kset->list_lock);
 }

| 1）遍历devices_kset的链表，取出所有的设备（struct device）；2）将该设备从链表中删除；3）调用pmm_runtime_get_noresume和pmm_runtime_barrier接口，停止所有的Runtime相关的电源管理动作；4）如果该设备的bus提供了shutdown函数，优先调用bus的shutdown，关闭设备；5）如果bus没有提供shutdown函数，检测设备driver是否提供，如果提供，调用设备driver的shutdown，关闭设备；6）直至处理完毕所有的设备。

系统中所有的设备都在“ /sys/devices/ ”目录下，这些设备是一个链表结构串起来的，devices_kset是链表头，里面都是struct device，然后找到对应的struct bus_type和struct device_driver等，然后按照优先级例如：class>bus>driver执行对应的shutdown回调函数。3.4 多 CPU 调度相关处理对于多CPU的机器，无论哪个CPU触发了当前的系统调用，代码都可以运行在任意的CPU上。这个接口将代码分派到一个特定的CPU上，并禁止调度器分派代码到其它CPU上。也就是说，这个接口被执行后，只有一个CPU在运行，用于完成后续的reboot动作。

void  migrate_to_reboot_cpu(void)
 {
         /* The boot cpu is always  logical cpu 0 */
         int cpu = reboot_cpu;

         cpu_hotplug_disable();

         /* Make certain the cpu I'm  about to reboot on is online */
         if (!cpu_online(cpu))
                 cpu =  cpumask_first(cpu_online_mask);

         /* Prevent races with other tasks  migrating this task */
         current->flags |=  PF_NO_SETAFFINITY;

         /* Make certain I only run on  the appropriate processor */
         set_cpus_allowed_ptr(current,  cpumask_of(cpu));
 }

| 1）CPU 0是默认重启使用的CPU2）禁止CPU热插拔3）如果CPU 0不在线，则设置当前CPU为第一个在线的CPU4）允许current进程在重启使用的CPU上运行 |

3.5 内核核心关闭

**system core的shutdown和设备的shutdown类似，也是从一个链表中，遍历所有的system core，并调用它的shutdown接口。\

3.6 硬件平台的关闭*

void  machine_power_off(void)
 {
         local_irq_disable();
         smp_send_stop();
         if (pmm_power_off)
                 pmm_power_off();
 }

| 1）屏蔽当前CPU上的所有中断，通过操作arm核心中的寄存器来屏蔽到达CPU上的中断，此时中断控制器中所有送往该CPU上的中断信号都将被忽略。2）对于多CPU的机器来说，Restart之前必须保证其它的CPU处于非活动状态，由其中的一个主CPU负责Restart动作。调用smp_send_stop接口，确保其它CPU处于非活动状态；这里会等待1秒时间来停止其他CPU。3）调用PSCI相关接口实现相关关机操作 |

3.7 内核

PSCI 相关操作****PSCI（Power State Coordination Interface）电源状态协调接口，是ARM定义的电源管理接口规范。PSCI 初始化流程： 在kernel的setup_arch启动时，扫描设备树节点信息关于psci部分，根据compatible来匹配到psci_0_2_init()函数，然后进入psci_probe()函数，并在psci_0_2_set_functions()函数中设置相关的函数指针：start_kernel() -> setup_arch() -> psci_dt_init() -> psci_0_2_init() -> psci_probe() -> psci_0_2_set_functions()设备树里面的信息如下里标记的版本是psci-0.2，method是使用smc。

| psci { compatible = "arm,psci-0.2"; method = "smc"; }; |

psci_0_2_set_functions会给处理函数赋值

static  void __init psci_0_2_set_functions(void)
 {
         pr_info("Using standard  PSCI v0.2 function IDs\n");
         psci_ops.get_version =  psci_get_version;

          psci_function_id[PSCI_FN_CPU_SUSPEND] =
                                          PSCI_FN_NATIVE(0_2, CPU_SUSPEND);
         psci_ops.cpu_suspend =  psci_cpu_suspend;

          psci_function_id[PSCI_FN_CPU_OFF] = PSCI_0_2_FN_CPU_OFF;
         psci_ops.cpu_off =  psci_cpu_off;

          psci_function_id[PSCI_FN_CPU_ON] = PSCI_FN_NATIVE(0_2, CPU_ON);
         psci_ops.cpu_on = psci_cpu_on;

         .....
         arm_pm_restart =  psci_sys_reset;
         pm_power_off = psci_sys_poweroff;

PSCI 关机流程：

#define  PSCI_0_2_FN_BASE                         0x84000000
 #define PSCI_0_2_FN(n)                          (PSCI_0_2_FN_BASE +  (n))
 #define PSCI_0_2_FN_SYSTEM_OFF                  PSCI_0_2_FN(8)

 static void psci_sys_poweroff(void)
 {
          invoke_psci_fn(PSCI_0_2_FN_SYSTEM_OFF, 0, 0, 0);
 }

PSCI_0_2_FN_SYSTEM_OFF的值计算为：0x84000000+8，查看ARM PSCI手册：

invoke_psci_fn（）在smc模式下对应 __invoke_psci_fn_smc（）函数：

static  unsigned long __invoke_psci_fn_smc(unsigned long function_id,
                         unsigned long  arg0, unsigned long arg1,
                         unsigned long  arg2)
 {
         struct arm_smccc_res res;

         arm_smccc_smc(function_id,  arg0, arg1, arg2, 0, 0, 0, 0, &res);
         return res.a0;
 }

arm_smccc_smc（）函数的实现为汇编代码，在arch/arm/kernel/smccc-call.S中

.macro SMCCC_SMC
    __SMC(0)
      .endm

 /* 定义SMCCC宏，其参数为instr */
         .macro SMCCC instr
 /* 将normal world中的寄存器入栈，保存现场 */
 UNWIND(        .fnstart)
         mov        r12, sp  /* r12指向老的sp地址 */
         push        {r4-r7}  /* 推r4-r7入栈，则sp = sp - 4 * 4 */
 UNWIND(        .save        {r4-r7})
         ldm        r12, {r4-r7}  /* 把r12指向的内容的刷入r4-r7，其实就是把参数a4-a7存入r4-r7
         \instr    /* 执行instr参数的内容，即执行smc切换 */
         pop        {r4-r7}   /* 出栈操作，恢复现场 */
         ldr        r12, [sp, #(4 * 4)]
         stm        r12, {r0-r3}
         bx        lr
 UNWIND(        .fnend)
         .endm

 ENTRY(__arm_smccc_smc)
         SMCCC SMCCC_SMC
 ENDPROC(__arm_smccc_smc)

SMCCC宏如下，smc指令触发一个安全监视器异常后，将栈上的数据存到x0~x3上，回头看 __invoke_psci_fn_smc函数实际是返回x0的结果。由于smccc_smc函数的入参有9个参数，按照约定，前4个参数存在r0 - r3，其他参数从右向左入栈。r0=a0, r1=a1, r2=a2, r3=a3, r4=a4, r5=a5, r6=a6, r7=a7进入 ATF 中 EL3 模式执行： smc指令是arm-v8手册中定义的一个指令，这个安全监视器触发一个异常，然后进入到EL3。EL3:安全监控异常级别。异常级别，用于执行安全监视器代码，用于处理非安全状态和安全状态之间的转换。EL3始终处于Secure状态.\

**4. ATF Bl31中的处理\

4.1 ATF 软件流程框图

BL31中smc异常触发流程图执行****SMC 指令****后会触发异常，进入 ATF 的**BL31**中继续执行：

在Linux侧调用smc异常之后，会根据中断向量表触发cpu的同步异常sync_exception_aarch64/32
然后跳转执行到handle_sync_exception->smc_handler64/32中
根据_RT_SVC_DESCS_START_+RT_SVC_DESC_HANDLE的位置，跳转执行rt_svc_desc_t结构体保存的服务std_svc_smc_handler
执行psci相关处理，找到psci_system_off和psci_system_rese处理函数。ATF直接处理如果是关机就执行halt指令，重启则通过设置gpio，或者转送给SCP处理。
最后跳转到el3_exit返回Linux侧。

SMC 异常触发执行流程：

进入ATF的方式触发异常：同步异常SMC、异步异常(irq,fiq)

如果是同步异常，那么一定是在linux或tee中发生了smc调用，此时进入跳转ATF中异常向量表中的同步异常程序smc_handler64或smc_handler32\ 在该程序中，解析smc id，来选择跳转到具体哪一个rt-svc(runtime service)
如果是异步异常，那么一定是触发了irq或fiq或serror中断等，此时进入跳转ATF中异常向量表中的异步异常程序，进而跳转到响应的中断处理函数.

4.2 内存布局 bl31_entrypoint****编译使用的lds文件是arm-trusted-firmware/bl31/bl31.ld.S，开头就可以看到入口是bl31_entrypoint：

ENTRY(bl31_entrypoint)

bl31_entrypoint在bl31/aarch64/bl31_entrypoint.S中定义可以看到设置 _exception_vectors为runtime_exceptions函数的：

/*  ---------------------------------------------------------------------
          * For !RESET_TO_BL31 systems,  only the primary CPU ever reaches
           * bl31_entrypoint() during the cold boot flow, so the cold/warm boot
          * and primary/secondary CPU  logic should not be executed in this case.
          *
          * Also, assume that the  previous bootloader has already initialised the
          * SCTLR_EL3, including the endianness, and  has initialised the memory.
          *  ---------------------------------------------------------------------
          */
         el3_entrypoint_common                                        \
                 _init_sctlr=0                                        \
                  _warm_boot_mailbox=0                                \
                  _secondary_cold_boot=0                                \
                 _init_memory=0                                        \
                 _init_c_runtime=1                                \
                 _exception_vectors=runtime_exceptions                \
                  _pie_fixup_size=BL31_LIMIT - BL31_BASE

在bl31/aarch64/runtime_exceptions.S中

     .globl        runtime_exceptions
 vector_base runtime_exceptions        //定义 .vectors
 vector_entry sync_exception_aarch64
         handle_sync_exception
         check_vector_size  sync_exception_aarch64
 vector_entry sync_exception_aarch32
         handle_sync_exception
         check_vector_size  sync_exception_aarch32

vector_base 是一个宏，在include/arch/aarch64/asm_macros.S中定义：

         .macro vector_base  label, section_name=.vectors//label为标号以冒号结尾
         .section \section_name,  "ax"//指定代码段必须存放在.vectors段里， “ax”表示该段可执行并且可‘a’读和可‘x’执行
         .align 11, 0//地址方式对齐11 其余字节用0填充
         \label:
         .endm

同样其他宏经过转化如下：

 .section  .vectors, "ax"        //指定代码段必须存放在.vectors段里， “ax”表示该段可执行并且可‘a’读和可‘x’执行
 .align 11, 0                        //地址方式对齐11 其余字节用0填充
 runtime_exceptions:
         .section .vectors,  "ax"//指定代码段必须存放在.vectors段里， “ax”表示该段可执行并且可‘a’读和可‘x’执行
         .align 7, 0                                //地址方式对齐7
         sync_exception_aarch64:
                 handle_sync_exception
                 .if (. -  serror_aarch64) > (32 * 4)        //这个.应该是当前位置 - 段的开头地址 如果大于 32条指令
             .error "Vector exceeds  32 instructions"                //向量超过32条指令
             .endif
         sync_exception_aarch32
              handle_sync_exception
                 .if (. -  serror_aarch64) > (32 * 4)        //这个.应该是当前位置 - 段的开头地址 如果大于 32条指令
             .error "Vector exceeds  32 instructions"                //向量超过32条指令
             .endif

4.3 runtime

服务程序初始化****bl31_entrypoint入口向下执行首先是bl31_setup，然后是bl31_main

 void  bl31_setup(u_register_t arg0, u_register_t arg1, u_register_t arg2,
                 u_register_t arg3)
 {
         /* Perform early  platform-specific setup */
          bl31_early_platform_setup2(arg0, arg1, arg2, arg3);

         /* Perform late  platform-specific setup */
         bl31_plat_arch_setup();

bl31_main（）函数：

void  bl31_main(void)
 {
         NOTICE("BL31: %s\n",  version_string);
         NOTICE("BL31: %s\n",  build_message);
         bl31_platform_setup();        //通用和安全时钟初始化，其他芯片相关功能初始化
         bl31_lib_init();        //空函数
         INFO("BL31: Initializing  runtime services\n");
         runtime_svc_init();        //重点 下面展开分析
         if (bl32_init) {       
                 INFO("BL31:  Initializing BL32\n");
                 (*bl32_init)();
         }
          bl31_prepare_next_image_entry();         //加载下一阶段的入口地址
         console_flush();        //控制台刷新
         bl31_plat_runtime_setup();        //空函数
 }

runtime_svc_init（）函数

//注册smc指令相关的服务
 void runtime_svc_init(void)
 {
         int rc = 0;
         unsigned int index, start_idx,  end_idx;

         /* Assert the number of  descriptors detected are less than maximum indices */
         //这句话表明  RT_SVC_DECS_NUM时当前加载的服务数量
         assert((RT_SVC_DESCS_END >=  RT_SVC_DESCS_START) &&
                         (RT_SVC_DECS_NUM < MAX_RT_SVCS));       


         if (RT_SVC_DECS_NUM == 0)        //如果没有服务要注册
                 return;
         memset(rt_svc_descs_indices,  -1, sizeof(rt_svc_descs_indices));//初始化rt_svc_descs_indices

         rt_svc_descs = (rt_svc_desc_t  *)RT_SVC_DESCS_START;//建立一个注册表结构体
         for (index = 0; index <  RT_SVC_DECS_NUM; index++) {
                 rt_svc_desc_t *service  = &rt_svc_descs[index];
                 rc = validate_rt_svc_desc(service);//判断每一个服务的各项参数是否正确
                 if (rc) {
                          ERROR("Invalid runtime service descriptor %p\n",
                                 (void  *) service);
                         panic();        //不正确
                 }
                 if (service->init)  {        //该服务是否需要初始化
                         rc =  service->init();        //进行初始化
                         if (rc) {        //初始化是否成功
                                  ERROR("Error initializing runtime service %s\n",
                                                  service->name);
                                  continue;
                         }
                 }
                 start_idx =  get_unique_oen(rt_svc_descs[index].start_oen,
                                 service->call_type);        //八位的id号
                 assert(start_idx <  MAX_RT_SVCS);
                 end_idx =  get_unique_oen(rt_svc_descs[index].end_oen,
                                  service->call_type);         //八位的id号
                 assert(end_idx <  MAX_RT_SVCS);
                 for (; start_idx <=  end_idx; start_idx++)
                          rt_svc_descs_indices[start_idx] = index;//证明可以根据rt_svc_descs_indices[?]的值找到其对应的rt_svc_descs[index]中index值
         }
 }

RT_SVC_DECS_NUM表示svc数量

| #define RT_SVC_DECS_NUM ((RT_SVC_DESCS_END - RT_SVC_DESCS_START)\ / sizeof(rt_svc_desc_t)) |

RT_SVC_DESCS_START开始的位置已经存入了结构体数据数组，因为在ld文件中进行了内存布局说明在bl31/bl31.ld.S中：

         RODATA_COMMON

         /* Place pubsub sections for  events */
         . = ALIGN(8);
 #include <lib/el3_runtime/pubsub_events.h>

         . = ALIGN(PAGE_SIZE);
         __RODATA_END__ = .;
     } >RAM
 #else
     ro . : {
         __RO_START__ = .;
         *bl31_entrypoint.o(.text*)
         *(SORT_BY_ALIGNMENT(.text*))
         *(SORT_BY_ALIGNMENT(.rodata*))

         RODATA_COMMON

在include/common/bl_common.ld.h中

#define  RODATA_COMMON                                        \
         RT_SVC_DESCS                                        \
          FCONF_POPULATOR                                        \
         PMF_SVC_DESCS                                        \
         PARSER_LIB_DESCS                                \
         CPU_OPS                                                 \
         GOT                                                 \
         BASE_XLAT_TABLE_RO                                \
         EL3_LP_DESCS

 #define RT_SVC_DESCS                                        \
         . = ALIGN(STRUCT_ALIGN);                        \
         __RT_SVC_DESCS_START__ =  .;                        \
         KEEP(*(rt_svc_descs))                                \
         __RT_SVC_DESCS_END__ = .;

rt_svc_descs段存放的内容是通过DECLARE_RT_SVC宏来定义的：//其中

 #define  DECLARE_RT_SVC(_name, _start, _end, _type,  _setup, _smch)        \
         static const rt_svc_desc_t  __svc_desc_ ## _name                         \
                 __section("rt_svc_descs") __used = {                        \
                         .start_oen =  (_start),                                 \
                         .end_oen =  (_end),                                 \
                         .call_type =  (_type),                                 \
                         .name = #_name,                                        \
                         .init =  (_setup),                                 \
                         .handle =  (_smch)                                 \
                 }

例如在services/std_svc/std_svc_setup.c中

/*  Register Standard Service Calls as runtime service */
 DECLARE_RT_SVC(
                 std_svc,

                 OEN_STD_START,
                 OEN_STD_END,
                 SMC_TYPE_FAST,
                 std_svc_setup,
                 std_svc_smc_handler
 );
 #define OEN_STD_START                         U(4)        /* Standard Service  Calls */
 #define OEN_STD_END                         U(4)
 #define SMC_TYPE_FAST                         UL(1)
 #define SMC_TYPE_YIELD                        UL(0)

static const rt_svc_desc_t __svc_desc_std_svc服务。其服务id为SMC_TYPE_FAST << 6 + OEN_STD_START,结束服务的id为SMC_TYPE_FAST << 6 + OEN_STD_ENDservice->init()会执行std_svc_setup（）函数->psci_setup((const psci_lib_args_t *)svc_arg)(void) plat_setup_psci_ops((uintptr_t)lib_args->mailbox_ep,\&psci_plat_pm_ops);plat_setup_psci_ops（）的定义根据平台，我们使用的是qemu，对应plat/qemu/qemu_sbsa/sbsa_pm.c文件中：

*psci_ops = &plat_qemu_psci_pm_ops;
static  const plat_psci_ops_t plat_qemu_psci_pm_ops = {
         .cpu_standby =  qemu_cpu_standby,
         .pwr_domain_on =  qemu_pwr_domain_on,
         .pwr_domain_off =  qemu_pwr_domain_off,
         .pwr_domain_pwr_down_wfi =  qemu_pwr_domain_pwr_down_wfi,
         .pwr_domain_suspend = qemu_pwr_domain_suspend,
         .pwr_domain_on_finish =  qemu_pwr_domain_on_finish,
         .pwr_domain_suspend_finish =  qemu_pwr_domain_suspend_finish,
         .system_off = qemu_system_off,
         .system_reset =  qemu_system_reset,
         .validate_power_state =  qemu_validate_power_state
 };

4.4 SMC 异常处理入口分析

SMC命令执行后，CPU会根据异常向量表找到sync_exception_aarch64的入口会执行handle_sync_exception，在bl31/aarch64/runtime_exceptions.S中

*  ---------------------------------------------------------------------
          * This macro handles  Synchronous exceptions.
          * Only SMC exceptions are  supported.
          *  ---------------------------------------------------------------------
          */
         .macro        handle_sync_exception
 #if ENABLE_RUNTIME_INSTRUMENTATION
         /*
          * Read the timestamp value and  store it in per-cpu data. The value
          * will be extracted from  per-cpu data by the C level SMC handler and
          * saved to the PMF timestamp  region.
          *///存放时间戳
         mrs        x30, cntpct_el0
         str        x29, [sp, #CTX_GPREGS_OFFSET +  CTX_GPREG_X29]
         mrs        x29, tpidr_el3
         str        x30, [x29, #CPU_DATA_PMF_TS0_OFFSET]
         ldr        x29, [sp, #CTX_GPREGS_OFFSET +  CTX_GPREG_X29]
 #endif

         mrs        x30, esr_el3  //将esr_el3存入x30
         //#define ESR_EC_SHIFT U(26)  #define ESR_EC_LENGTH U(6)
         //相当于 保留 x30的bit[31-26]并将这几位提到bit[6-0]
         ubfx        x30, x30, #ESR_EC_SHIFT, #ESR_EC_LENGTH

         /* Handle SMC exceptions  separately from other synchronous exceptions */
         cmp        x30, #EC_AARCH32_SMC
         b.eq        smc_handler32

         cmp        x30, #EC_AARCH64_SMC
         b.eq        sync_handler64

         cmp        x30, #EC_AARCH64_SYS
         b.eq        sync_handler64

         /* Synchronous exceptions other  than the above are assumed to be EA */
         ldr        x30, [sp, #CTX_GPREGS_OFFSET +  CTX_GPREG_LR]
         b        enter_lower_el_sync_ea
         .endm

三种跳转选项其中smc_handler32/64能够正确触发异常，report_unhandled_exception则是错误的流程

#define  EC_AARCH32_SMC                         U(0x13)
 #define EC_AARCH64_SVC                         U(0x15)
 #define EC_AARCH64_HVC                         U(0x16)
 #define EC_AARCH64_SMC                        U(0x17)

x30里面存储的是esr_el3 的26-32位，里面是什么判断了smc64当前平台架构是aarch64的，看一下sync_handler64这个处理，在bl31/aarch64/runtime_exceptions.S中

   /* Load descriptor index from array  of indices */
         //在runtime_svc_init()中会将所有的section rt_svc_descs段放入rt_svc_descs_indices数组，
         //这里获取该数组地址
         adrp        x14, rt_svc_descs_indices
         add        x14, x14, :lo12:rt_svc_descs_indices
         ldrb        w15, [x14, x16]//找到rt_svc在rt_svc_descs_indices数组中的index

          /*
          * Get the descriptor using the  index
          * x11 = (base + off), w15 =  index 这个index就是rt_svc_descs结构体数组下标
          *
          * handler = (base + off) +  (index << log2(size))
          */
         adr        x11, (__RT_SVC_DESCS_START__  + RT_SVC_DESC_HANDLE) //base + off
         lsl        w10, w15, #RT_SVC_SIZE_LOG2 //(index << log2(size))
         ldr        x15, [x11, w10, uxtw]  //handler  = (base + off) + (index << log2(size))

         blr        x15//跳转到handler

         b        el3_exit

sync_handler64里找rt_svc_desc_t结构体类型里面的handle处理函数，而这些处理函数在rt_svc_descs节中一个问题： 怎么找到 index ？ ****例如发的一个smc消息id是0x84000000+8

•bit31决定是fast call，还是std call(yield对应的就是std call)•bit30表示是以32位传参，还是以64位传参，注意我们看了optee在linux的driver，都是以32位方式•bit29:24 决定服务的类型•bit23:16 reserved•bit15:0每种call类型下，表示range这个地方值为4，

/*  Register Standard Service Calls as runtime service */
 DECLARE_RT_SVC(
                 std_svc,
                 OEN_STD_START,
                 OEN_STD_END,
                 SMC_TYPE_FAST,
                 std_svc_setup,
                 std_svc_smc_handler
 );
 #define OEN_STD_START                       U(4)        /* Standard Service Calls */
 #define OEN_STD_END                         U(4)

系统启动的时候会把index信息存入到rt_svc_descs_indices里面，根据4取出来就可以了。

    start_idx  = (uint8_t)get_unique_oen(service->start_oen,service->call_type);
    end_idx =  (uint8_t)get_unique_oen(service->end_oen,service->call_type);
    assert(start_idx <=  end_idx);
    assert(end_idx <  MAX_RT_SVCS);
      for (; start_idx <=  end_idx; start_idx++)
        rt_svc_descs_indices[start_idx]  = index;

base+index << log2(size)找到结构体数组index对应的元素，然后off就是结构体内handle对应的函数。handler = (base + off) + (index << log2(size))翻译过来如下：w15 = （RT_SVC_DESCS_START + RT_SVC_DESC_HANDLE） + w15<< log2(size)\

4.5 smc 服务处理分析

****std_svc_smc_handler（）中，可以看到会调用psci_smc_handler函数。

/*
  * Top-level Standard Service SMC  handler. This handler will in turn dispatch
  * calls to PSCI SMC handler
  */
 static uintptr_t std_svc_smc_handler(uint32_t smc_fid,
                               u_register_t x1,
                               u_register_t x2,
                               u_register_t x3,
                               u_register_t x4,
                              void  *cookie,
                              void  *handle,
                               u_register_t flags)
 {
                 ret =  psci_smc_handler(smc_fid, x1, x2, x3, x4,
                     cookie, handle,  flags);

而在psci_smc_handler函数中，就可以看到上面传入的psci传入的PSCI_SYSTEM_OFF指令

| case PSCI_SYSTEM_OFF: psci_system_off(); /* We should never return from psci_system_off() */ break; |

在psci_system_off进去就打印psci相关的打印，然后调用system_off回调。

void  __dead2 psci_system_off(void)
 {
         psci_print_power_domain_map();//打印

          assert(psci_plat_pm_ops->system_off != NULL);

         /* Notify the Secure Payload  Dispatcher */
         if ((psci_spd_pm != NULL)  && (psci_spd_pm->svc_system_off != NULL)) {
                  psci_spd_pm->svc_system_off();
         }

         console_flush();

         /* Call the platform specific  hook */
          psci_plat_pm_ops->system_off();

         /* This function does not  return. We should never get here */
 }

psci_print_power_domain_map()的打印再和设备重启时的日志进行对比，发现是一致的。

4.5 硬件平台相关处理

****在qemu平台上的实现如下：psci_plat_pm_ops系统初始化的时候会赋值.system_off = qemu_system_off,

static  void __dead2 qemu_system_off(void)
 {
 #ifdef SECURE_GPIO_BASE
         ERROR("QEMU System Power  off: with GPIO.\n");
          gpio_set_direction(SECURE_GPIO_POWEROFF, GPIO_DIR_OUT);
          gpio_set_value(SECURE_GPIO_POWEROFF, GPIO_LEVEL_LOW);
          gpio_set_value(SECURE_GPIO_POWEROFF, GPIO_LEVEL_HIGH);
 #else
         semihosting_exit(ADP_STOPPED_APPLICATION_EXIT,  0);
         ERROR("QEMU System Off:  semihosting call unexpectedly returned.\n");
 #endif
         panic();
 }
semihosting_exit：
func  semihosting_call
         hlt        #0xf000
         ret
 endfunc semihosting_call

semihosting_exit ：

对应重启，qemu_system_reset（）函数设置GPIO实现

gpio_set_direction(SECURE_GPIO_RESET,  GPIO_DIR_OUT);
          gpio_set_value(SECURE_GPIO_RESET, GPIO_LEVEL_LOW);
          gpio_set_value(SECURE_GPIO_RESET, GPIO_LEVEL_HIGH);

如果不是ATF里面自己处理，有SCP，见下章节分析。

5. SCP中的处理

mhu模块： mhu_isr收到中断status = smt_channel->api->signal_message(smt_channel->id);

signal_message是smt模块里面提供的，对共享内存的数据进行处理

status =  fwk_module_bind(smt_channel->id,
   FWK_ID_API(FWK_MODULE_IDX_SMT,  MOD_SMT_API_IDX_DRIVER_INPUT), &smt_channel->api);

文章篇幅有点多了，具体代码就不分析了，可以参考：[ARM SCP入门-AP与SCP通信](http://mp.weixin.qq.com/s?__biz=MzUzMDMwNTg2Nw==\&mid=2247484475\&idx=1\&sn=09183060a3506b1fdcd0af4d4877c89f\&chksm=fa52821fcd250b091731b09a971f655dbc6bc92f2fa7b4ea9df457f02401717c95510883e53c\&scene=21#wechat_redirect)，另外关于核间通信的细节里面没有说明，具体就是mhu或者PL320的驱动代码，以及共享内存的具体操作，后续专门写几篇核间通信的文章。

后记

本篇文章代码有点多，其实撸代码的过程也挺有趣味的，特别是加上自己的log打印，就有了自己可以控制的感觉，即时反馈带来游戏的快感。另外从职业技能上说，掌握一个方向的技术成为专家，也能让自己有个饭碗，加油，同志们。

“啥都懂一点，啥都不精通，

干啥都能干，干啥啥不是，

专业入门劝退，堪称程序员杂家”。

后续会继续更新，纯干货分析，欢迎分享给朋友，欢迎评论交流！

电源管理入门-1关机重启详解

电源管理入门-1关机重启详解

1.1 用户层利用reboot、poweroff等命令进行关机，在应用层会执行：

1.2 Linux 内核层reboot系统调用会进入内核，具体流程为：

1.3 ATF 层执行SMC指令后会触发异常，进入ATF的BL31中继续执行：

1.4 SCP 层

2. Busybox中的关机重启命令

3. Linux内核中的处理\

3.1 系统调用实现****在kernel/reboot.c中声明了rboot系统调用的实现：

3.2 内核关机函数分析

3.3 关闭所有设备处理

3.5 内核核心关闭

3.6 硬件平台的关闭*

3.7 内核

**4. ATF Bl31中的处理\

4.1 ATF 软件流程框图

4.3 runtime

4.4 SMC 异常处理入口分析

4.5 smc 服务处理分析

4.5 硬件平台相关处理

5. SCP中的处理

后记

results matching ""

No results matching ""

电源管理入门-1关机重启详解

1.1 用户层****利用reboot、poweroff等命令进行关机，在应用层会执行：

1.2 Linux 内核层**reboot系统调用会进入内核，具体流程为：**

1.3 ATF 层**执行SMC指令后会触发异常，进入ATF的BL31中继续执行：**

1.4 SCP 层

2. Busybox中的关机重启命令

3. Linux内核中的处理\

3.1 系统调用实现****在kernel/reboot.c中声明了rboot系统调用的实现：

3.2 内核关机函数分析

3.3 关闭所有设备处理

3.5 内核核心关闭

3.6 硬件平台的关闭*

3.7 内核

**4. ATF Bl31中的处理\

**4.1 ATF 软件流程框图**

4.3 runtime

4.4 SMC 异常处理入口分析

4.5 smc 服务处理分析

4.5 硬件平台相关处理

5. SCP中的处理

后记

results matching ""

No results matching ""

1.1 用户层利用reboot、poweroff等命令进行关机，在应用层会执行：

1.2 Linux 内核层reboot系统调用会进入内核，具体流程为：

1.3 ATF 层执行SMC指令后会触发异常，进入ATF的BL31中继续执行：

4.1 ATF 软件流程框图