ECS 云助手,实现云上运维自动化

 

凌云时刻 · 技术

导读:本期为“玩转 ECS”系列第 9 讲完结篇,由阿里云智能技术专家朱士松(锐奇)为大家介绍如何使用 ECS 云助手。

嘉宾 | 朱士松

整理 | 董智颖

来源 | 凌云时刻(微信号:linuxpk)

前言

近期,“凌云时刻”特别推出“阿里云玩转 ECS”系列课程,每周二、周四准时更新,欢迎关注。点击文末“阅读原文”可查看本系列所有已发布内容。

本次内容由阿里云智能技术专家朱士松(锐奇)为大家介绍《ECS 云助手,实现云上运维自动化》。

以往需要操作 ECS 实例内部的系统时,要先通过公网或跳板机或远程桌面登入实例,而后在实例内执行一些文件或命令操作。如果使用 ECS 云助手,不但免除公网环境的限制需求,而且能通过阿里云 OpenAPI 完全自动化地实现文件发送与执行命令,适用于在 ECS 实例内部署与更新应用、监控系统或应用的运行状态、以及批量操作多个实例内部系统的这些场景。本篇内容适合于 ECS 系统运维人员。

关键词:ECS 运维、远程操作、自动化

朱士松 (锐奇),阿里云技术专家,2016 年加入阿里云,先后开发了 ECS 售卖约束系统、阿里云区块链服务,目前负责 ECS 云助手。

以下内容根据演讲视频以及 PPT 整理而成。

本次分享主要围绕以下四个方面:

一、云助手功能简介

二、使用说明与演示

三、远程操作方式比较

四、云助手的适用场景

ECS 云助手简介

云助手是阿里云 ECS 提供的一种自动化的远程操作方式,在阿里云官方的系统镜像中几乎都包含有云助手。

云助手的使用方法比较简单,只有两项主要功能:

1. 向指定的实例发送命令,对应 API ecs:RunCommand

2. 向指定的实例发送文件,对应 API ecs:SendFile

 通过 API 使用云助手

 发送命令(RunCommand)

发送命令的功能,由 ECS:RunCommand API 承载,API 的主要参数如下:

aliyun ecs RunCommand \
  --RegionId="cn-shenzhen" \
  --InstanceId.1="i-wz9g75dkmfp0ofsplnlr" \
  --InstanceId.2="i-wz9g75dkmfp0ofsplnls" \
  --Type="RunShellScript" \
  --CommandContent="yum install -y git" \
  --Timeout=60
  • 参数:RegionId - 指的是目标 ECS 实例所在的地域

  • 参数:InstanceId - 可以指定该地域下的一个或多个 ECS 实例

  • 参数:Type - 指的是脚本类型,目前支持三种:分别是

    • Linux 上支持执行 Shell 脚本,类型值 RunShellScript

    • Windows 上支持的 Batch 与 PowerShell 脚本,类型值 RunBatScript 与 RunPowerShellScript

  • 参数:CommandContent - 指的是脚本内容,比如当前示例通过 yum 安装 git 客户端

  • 参数:Timeout - 批的时脚本执行超时时间,默认 60 秒

关于 ecs:RunCommand 的详细 API 文档:
https://help.aliyun.com/document_detail/141751.html

推荐使用 aliyun 命令行工具执行阿里云 API:
https://help.aliyun.com/document_detail/110244.html

调用了 RunCommand 之后,将会创建一个任务,并返回 InvokeId 值;之后可使用 DescribeInvocationResults 轮论这次任务的执行进度与结果;关于 DescribeInvocationResults 说明,请参见文档:
https://help.aliyun.com/document_detail/64845.html

 发送文件 (SendFile)

发送文件的功能,由 SendFile API 承载,API 的主要参数如下:

aliyun ecs SendFile \
  --RegionId="cn-shenzhen" \
  --InstanceId.1="i-wz9g75dkmfp0ofsplnlr" \
  --InstanceId.2="i-wz9g75dkmfp0ofsplnls" \
  --TargetDir="/root/.ssh/" \
  --Name="authorized_keys" \
  --Content="ssh-rsa AAAA...."
  • 其他参数:RegionId & InstanceId - 指定实例所在地域和实例 ID 列表

  • 参数:TargetDir 与 Name - 分别指定文件在实例上的目录名与文件名

  • 参数:Content - 指定文件的内容

关于 ecs:SendFile 的详细 API 文档:
https://help.aliyun.com/document_detail/184118.html

调用了 SendFile 之后,也将会创建一个任务,并返回 InvokeId ;之后可使用 DescribeSendFileResults 轮论这次任务的执行进度与结果。

了解了以上两对 API,也就学会云助手的主要用法,那么就可以在脚本或代码中使用。

 通过控制台使用云助手

如果想通过阿里云控制台使用云助手,可以从这个两个位置找到“云助手”控制台:

1. 一是 ECS 控制台左侧的“运维与监控” 服务列表这里:
https://ecs.console.aliyun.com/

2. 二是 ECS“实例详情”页面的“本实例远程命令”

使用实践示例

接下来,咱们通过一个实践,体验一下云助手的使用,实现一项常规的任务:将一个应用的代码自动部署到 ECS 服务器上,并且当代码更新时立即更新服务。

 准备的资源

将要使用的资源如下:

1. 应用代码:这里使用示例代码是 spring-boot 的官方示例程序 gs-rest-service 并稍有修改。

代码库地址:
https://github.com/treesong/gs-rest-service

2. 代码编译机:一台 ECS,将安装 JDK + git + maven,负责下载和编译代码并打包。

3. Web服务器:三台 ECS,负责将安装 JRE,部署代码包,并启动 Web 应用。

4. 负载均衡:一个 SLB,后端挂载这三台 Web 应用服务器,并对外提供服务。

 操作的步骤

操作步骤如下:

 创建虚拟专有网络(VPC)与虚拟交换机

如果您已经拥有虚拟专有网络与虚拟交换机,可以跳过本步骤。

转到 VPC 控制台, 创建 VPC 实例及交换机:
https://vpc.console.aliyun.com/vpc/cn-shenzhen/vpcs/new

新建 VPC 的设置项:

  • VPC 名称:vpc-for-assist-demo

    • IPv4 网段:192.168.0.0/16

  • 交换机名称:vsw-for-axt-demo-d

    • IPv4 网络:192.168.0.0/29

  • 其他选项:可使用默认值,或按需自由设置

注:在实际应用中,您也可以根据网络规划需要,选择使用其他网段

 创建一台 ECS 实例,用作编译服务器

新建 ECS 的设置项:

  • 数量:1 台

  • 镜像:CentOS,或其他 Linux 类型

  • 网络:专有网络,并选择上一步创建的专有网络(vpc-for-assist-demo)与交换机(vsw-for-axt-demo-d)

  • 公网 IP:不需要

  • 实例名称:code-compile-server

  • 主机名称:code-compile-server

  • 其他选项:可使用默认值,或按需自由设置

确认订单,以创建 ECS 实例。

 另创建两台 ECS 实例,用作应用服务器

在现有的 VPC 实例 vpc-for-assist-demo 下,另创建一个新虚拟交换机实例,设置项:

  • 交换机名称:vsw-for-axt-demo-e

  • IPv4 网络:192.168.1.0/29

  • 其他选项:可使用默认值,或按需自由设置

在新的虚拟交换机实例 (vsw-for-axt-demo-e) 下,创建 3 台 ECS 作为应用服务器,设置项:

  • 数量:2 台

  • 镜像:CentOS,或其他 Linux 类型

  • 网络:专有网络,并选择上一步创建的专有网络实例与交互机(vsw-for-axt-demo-e)

  • 公网IP:不需要

  • 实例名称:webapp-server-

  • 主机名称:webapp-server-

  • 有序后辍:是,为 实例名称 和 主机名 添加有序后缀

  • 其他选项:可使用默认值,或按需自由设置

确认订单,以创建 ECS 实例。

 配置 VPC 网络以允许 ECS 实例出公网

因需要从公网上下载源代码等,因此需要允许 ECS 实例 code-compile-server 可访问公网,需要:

  • 配置 vpc-for-assist-demo 的 NAT 网关

  • 为该 NAT 网关创建 SNAT 条目,为 vsw-for-axt-demo-d 绑定一个公网 IP

(略过该步骤的详细过程,如需详细步骤,请参考 VPC 的使用资料)

 编译机的初始化

转到云助手的控制台:
https://ecs.console.aliyun.com/#/cloudAssistant/region/cn-shenzhen

  • 编译机的初始化

创建以下命令,以初始化编译机(code-compile-server),作用

  • 安装 JDK

  • 安装 GIT

  • 下载 Maven 并配置 settings.xml

  • 生成访问 github.com 的密钥对

  • 命令名称:1-init-compiler-server.sh

  • 命令类型:Shell

  • 超时时间:600(秒)

  • 命令内容:如下,或从以下地址获得
    https://github.com/treesong/aliyun-assist-demo

## 阿里云-云助手使用演示
## [编译机]


## 检测/安装 JDK
java -version
if [ $? = 127 ]; then
    yum install -y java-1.8.0-openjdk-devel
    echo "install java done"
    java -version
fi;
printf "_____\n\n"


## 检测/安装 GIT
git --version
if [ $? = 127 ]; then
    yum install -y git
    echo "install git done"
fi;
printf "_____\n\n"


## 检测/下载 Maven
cd /root
if [ ! -d "/root/apache-maven" ]; then
    wget -q https://mirrors.bfsu.edu.cn/apache/maven/maven-3/3.6.3/binaries/apache-maven-3.6.3-bin.zip
    unzip -q -o -d ./ ./apache-maven-3.6.3-bin.zip
    ln -s /root/apache-maven-3.6.3/ /root/apache-maven
fi;


export PATH=/root/apache-maven/bin/:$PATH
mvn --version
printf "_____\n\n"


## 更新 maven settings.xml 配置
echo '
<settings xmlns="http://maven.apache.org/SETTINGS/1.0.0"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://maven.apache.org/SETTINGS/1.0.0 http://maven.apache.org/xsd/settings-1.0.0.xsd">


    <localRepository>/root/.m2/repository</localRepository>


    <mirrors>
        <mirror>
            <id>aliyun</id>
            <name>aliyun Maven</name>
            <mirrorOf>central</mirrorOf>
            <url>http://maven.aliyun.com/nexus/content/groups/public/</url>
        </mirror>
        <mirror>
            <id>CN</id>
            <name>OSChina Central</name>
            <url>http://maven.oschina.net/content/groups/public/</url>
            <mirrorOf>central</mirrorOf>
        </mirror>
    </mirrors>


    <profiles></profiles>


</settings>
' > /root/apache-maven/conf/settings.xml




## 生成 git 密钥
if [ ! -f "/root/.ssh/id_rsa_git" ]; then
    ssh-keygen -q -t rsa -b 4096 \
      -C "treesong@github.com" \
      -f /root/.ssh/id_rsa_git \
      -N ""
fi;


## 配置自动选择 git 密钥
echo "host github.com
    HostName github.com
    StrictHostKeyChecking no
    User treesong
    IdentityFile /root/.ssh/id_rsa_git
" > /root/.ssh/config


echo "===== beging pub key for git ====="
cat /root/.ssh/id_rsa_git.pub
echo "===== end pub key for git ====="

点击“保存”按钮,保存该条命令。

如上图,已经创建了该条命令,继续“执行”,并选择 ECS 实例 code-compile-server。

等待执行完成。

命令执行所生成的 git 公钥,请用来添加在您的 git 帐号中,以允许从主机 code-compile-server 内从 github 上拉取应用代码:
https://github.com/treesong/aliyun-assist-demo

  • 生成 ssh 密钥对,以免密编译机分发应用包到应用服务器

注:您也可以将应用包上传到 OOS 中,并在应用服务器内下载应用包

创建以下命令,以初始化编译机(code-compile-server),作用:

  • 生成一个 ssh 密钥对,以用于 scp 应用包到应用服务器

  • 命令名称:2-generate-ssh-key.sh

  • 命令类型:Shell

  • 命令内容:如下,或从以下地址获得
    https://github.com/treesong/aliyun-assist-demo

  • 使用参数:是

## 生成 ssh 密钥
if [ ! -f "/root/.ssh/id_rsa_ssh" ]; then
    ssh-keygen -q -t rsa -b 4096 \
      -C "ruiqi@alibaba-inc.com" \
      -f /root/.ssh/id_rsa_ssh \
      -N ""
fi;


echo "===== begin pub key for ssh ====="
cat /root/.ssh/id_rsa_ssh.pub
echo "===== end pub key for git ====="
echo ""
done;

选择实例 code-compile-server 并执行该脚本,执行完成后将显示新生成的 id_rsa_ssh.pub 文件内容。

 应用服务器的初始化

添加 ssh 免密登录公钥到应用服务器 (webapp-server-*)。 

  • 添加 ssh 免密登录公钥 (公钥内容来自上一步生成的 id_rsa_ssh.pub 文件内容)

  • 命令名称:3-append-ssh-keys

  • 命令类型:shell

  • 命令内容:如下,或从以下地址获得
    https://github.com/treesong/aliyun-assist-demo

  • 使用参数:是

if [ -f "/root/.ssh/authorized_keys" ]; then
    ssh_key=$(cat /root/.ssh/authorized_keys | grep "ruiqi@alibaba-inc.com")
    
    if [ -z "${ssh_key}" ]; then
        echo "{{ssh-rsa-pub}}" >> /root/.ssh/authorized_keys
    fi;
else
    echo "{{ssh-rsa-pub}}" > /root/.ssh/authorized_keys
fi;


echo "===== content of ssh-rsa-pub ====="
cat /root/.ssh/authorized_keys | grep "ruiqi@alibaba-inc.com"
mkdir -p /root/webapp

执行命令 3-append-ssh-keys.sh,选项:

  • 参数 ssh-ras-pub:内容填入 2-generate-ssh-key 生成与打印的 id_rsa_ssh.pub 文件内容

  • 目标实例:选择全部的 webapp-server-* 实例

 编译与分发代码

拉取最新的代码,编译打包,并分发到应用服务器。

创建命令选项:

  • 命令名称:4-pull-build-deploy-code

  • 命令类型:Shell

  • 命令内容:如下,或从以下地址获得
    https://github.com/treesong/aliyun-assist-demo

  • 使用参数:是

## [编译机]
## 下载源代码
if [ ! -d "/root/source/gs-rest-service" ]; then
    mkdir -p /root/source && cd /root/source
    git clone git@github.com:treesong/gs-rest-service.git
fi;


## 拉取新代码
echo "> cd /root/source/gs-rest-service/complete"
cd /root/source/gs-rest-service/complete
echo "> git pull ..."
git pull && git checkout {{branch}}
printf "_____\n\n"


## 编译代码
export PATH=/root/apache-maven/bin/:$PATH
echo "> mvn clean package -Dmaven.test.skip=true"
mvn clean package -Dmaven.test.skip=true
printf "_____\n\n"


## 分发代码
if [ ! -z "{{vm-ip-list}}" ]; then
  for ip in {{vm-ip-list}}; do
    echo "> scp *.jar to $ip ..."
    scp -i /root/.ssh/id_rsa_ssh.pub ./target/rest-service-0.0.1-SNAPSHOT.jar root@$ip:/root/webapp/
  done;
  echo "copy files done."
else
  echo "copy files skip."
fi;

执行命令选项:

  • 命令参数:

    • branch: 等部署的代码分支

    • vm-ip-list:应用服务器 IP 列表

  • 目标实例:代码服务器(code-compile-server)

 启动/重启 Web 应用

在 webapp-server-* 上启动应用。

  • 检查与安装 JRE

  • 停止 WebApp

  • 启动 WebApp

创建命令选项:

  • 命令名称:5-start-webapp-server

  • 命令类型:Shell

  • 命令内容:如下,或从以下地址获得
    https://github.com/treesong/aliyun-assist-demo

## 阿里云-云助手使用演示
## [应用服务器]
## 安装 JRE/JDK


java -version
if [ $? = 127 ]; then
    echo "install jdk ..."
    yum install -y java-1.8.0-openjdk-devel
    echo "install jdk done"
    java -version
fi;
printf "_____\n\n"


## 停止 WebApp
pid=$(jps -l | grep jar | cut -d' ' -f 1)
if [[ $pid =~ ^[0-9]+$ ]]; then
   jps -l | grep jar 
   echo "stop java process $pid ..."
   kill -9 $pid
fi;


pid=$(jps -l | grep rest | cut -d' ' -f 1)
if [[ $pid =~ ^[0-9]+$ ]]; then
   jps -l | grep rest
   echo "stop java process $pid ..."
   kill -9 $pid
fi;
printf "_____\n\n"


## 启动 WebApp
if [ -f  "/root/webapp/rest-service-0.0.1-SNAPSHOT.jar" ]; then
    echo "> ls -l1 --color "/root/webapp""
    ls -l1 --color "/root/webapp"
    printf "_____\n\n"
    
    echo "start java rest webapp ..."
    /bin/bash -c "java -jar /root/webapp/rest-service-0.0.1-SNAPSHOT.jar > /dev/null &"


    for i in {1..60}; do
        echo "[$i] > curl -s http://localhost:8080/ping"
        msg=$(curl -s http://localhost:8080/ping)
        if [ "$msg" = "pong" ]; then
            echo "[$i] > $msg"
            pid=$(jps -l | grep rest | cut -d' ' -f 1)
            echo "java webapp started, pid: $pid"
            break;
        fi;


        echo "wait for java webapp starts ...."
        sleep 2
    done;
else 
    echo "file not exists: /root/webapp/rest-service-0.0.1-SNAPSHOT.jar"
    exit 127
fi;

执行命令选项:

  • 目标实例:选择全部的 webapp-server-*

执行命令,并等待执行完成。

 挂载应用服务器到 SLB,以供互联网访问

 操作小结

通过以上的演示,大家可以看到,全程不需要连接进入实例系统内部;通过使用云助手发送脚本命令,就可以完成实例内部的变更运维操作;因此,你可以通过阿里云 OpenAPI 自动化的实现以上操作,并且当代码有更新时,自动触发该系列操作,实现自动更新应用。可以访问以下地址获得更多的自动化脚本,或使用阿里云提供的相关应用部署服务:
https://github.com/treesong/aliyun-assist-demo

远程操作方式比较

相比于其他常用登入系统的方式,例如 Linux SSH 或 Windows 的 RemteDesktop ,云助手的以下多个方面的个方面优势:

 免公网流量

云助手的功能实现,是通过控制系统来完成。所以不需要让实例暴露在公网上,即有利于实例的安全,也节省了公网流量费用。

 免登入系统

登入系统需要有系统的帐号用户与密码,或者私钥;而密码与私钥的使用与管理上有许多不便。云助手一切操作使用都基于阿里云帐号AK,有云上强大的帐号/AK 管理体系。

 有权限控制

通过 RAM 角色与权限的管理,所以做到严格的控制子帐号是否执行特定操作的能力,可以事前防止不被授权的操作。

 有操作审计

同样,云上的 API 操作都有 ActionTrail 记录,可以被事后审计。

 支持自动化

这也是云助手最显著的优势,有了 API 就可以很容易的跟其他系统集成,以实现云上运维的。

云助手的适用场景

通过以上的介绍与演示,咱们可以体会到,借助云助手,能够自动化的处理 ECS 实例创建后的多个使用环节,例如:

  • 系统与应用的安装配置

  • 服务程序的部署与更新

  • 系统的监控与数据采集

  • 系统的问题诊断与修复

阿里云也有在这些方面上继续丰富的服务,给大家的工作来带来更多的便利。

END

往期精彩文章回顾

米熊科技:给烘培加点“云”的味道

服务器迁移中心 SMC 最佳实践及新特性介绍

云原生体系下的技海浮沉与理论探索

最后7天!阿里云2020云内存数据库峰会现场参会报名中

倒计时1周!聚焦金融科技,Gdevops北京站即将启程

阿里达摩院赵昆:获评“中国客户服务领袖”

ECS 数据保护——数据备份新特性与最佳实践

浅谈原子操作

弹性计算 Region 化部署和跨可用区容灾介绍

6 岁!是时候重新认识下 Serverless 了


长按扫描二维码关注凌云时刻

每日收获前沿技术与科技洞见

相关推荐