README.md 10.4 KB
Newer Older
wu-sheng's avatar
wu-sheng 已提交
1
# Sky Walking
wu-sheng's avatar
wu-sheng 已提交
2
SkyWalking: Large-Scale Distributed Systems Tracing Infrastructure, 是一个对JAVA分布式应用程序集群的业务运行情况进行追踪、告警和分析的系统。
wu-sheng's avatar
wu-sheng 已提交
3 4
* 核心理论为[Google Dapper论文:Dapper, a Large-Scale Distributed Systems Tracing Infrastructure](http://research.google.com/pubs/pub36356.html),英语有困难的同学可参考[国内翻译](http://duanple.blog.163.com/blog/static/70971767201329113141336/)
* 本分析系统能通过不修改或少量修改代码的模式,对现有的JAVA应用或J2EE应用进行监控和数据收集,并针对应用进场进行准实时告警。此外提供大量的调用性能分析功能,解决目前的监控系统主要监控进程、端口而非应用实际性能的问题。
wu-sheng's avatar
wu-sheng 已提交
5 6 7
* 支持国内常用的dubbo以及dubbox等常见RPC框架,支持应用异常的邮件告警

# 新版本能力规划
wu-sheng's avatar
wu-sheng 已提交
8
* 提供一定的日志数据分析和展现能力,减少或者避免使用团队的二次开发
wu-sheng's avatar
wu-sheng 已提交
9
* 通过javaagent和[byte-buddy](https://github.com/raphw/byte-buddy)减少代码侵入性,增加更多的组件支持
wu-sheng's avatar
wu-sheng 已提交
10

wu-sheng's avatar
wu-sheng 已提交
11
# 主要贡献者
wu-sheng's avatar
wu-sheng 已提交
12 13
* 吴晟   [亚信](http://www.asiainfo.com/) wusheng@asiainfo.com
* 张鑫   [亚信](http://www.asiainfo.com/) zhangxin10@asiainfo.com
wu-sheng's avatar
wu-sheng 已提交
14

wu-sheng's avatar
wu-sheng 已提交
15 16
# 交流
* 联系邮箱:wu.sheng@foxmail.com
wu-sheng's avatar
wu-sheng 已提交
17
* QQ群:392443393,请注明“Sky Walking交流”
wu-sheng's avatar
wu-sheng 已提交
18
* 谁在使用Sky Walking?[点击进入](https://github.com/wu-sheng/sky-walking/issues/34)。同时请各位使用者反馈下,都在哪些项目中使用。
wu-sheng's avatar
wu-sheng 已提交
19

wu-sheng's avatar
wu-sheng 已提交
20 21 22
# 整体架构图
![整体架构图](http://wu-sheng.github.io/sky-walking/sample-code/images/skywalkingClusterDeploy.jpeg)

wu-sheng's avatar
wu-sheng 已提交
23 24 25
# 典型页面展现
## 实时调用链路
* 实时链路追踪展现
wu-sheng's avatar
wu-sheng 已提交
26
![追踪连路图1](http://wu-sheng.github.io/sky-walking/sample-code/screenshoot/callChain.png)
wu-sheng's avatar
wu-sheng 已提交
27
* 实时链路追踪详细信息查看
wu-sheng's avatar
wu-sheng 已提交
28
![追踪连路图2](http://wu-sheng.github.io/sky-walking/sample-code/screenshoot/callChainDetail.png)
wu-sheng's avatar
wu-sheng 已提交
29
* 实时链路追踪日志查看
wu-sheng's avatar
wu-sheng 已提交
30
![追踪连路图3](http://wu-sheng.github.io/sky-walking/sample-code/screenshoot/callChainLog.png)
wu-sheng's avatar
wu-sheng 已提交
31 32
* 实时链路异常告警邮件
![告警邮件](http://wu-sheng.github.io/sky-walking/sample-code/screenshoot/alarmMail.jpg)
wu-sheng's avatar
wu-sheng 已提交
33

wu-sheng's avatar
wu-sheng 已提交
34
## 分析汇总
wu-sheng's avatar
wu-sheng 已提交
35

wu-sheng's avatar
wu-sheng 已提交
36
# Quick Start
wu-sheng's avatar
wu-sheng 已提交
37
## 编译与部署
wu-sheng's avatar
wu-sheng 已提交
38
### 部署第三方软件
wu-sheng's avatar
wu-sheng 已提交
39
- JDK 1.7
wu-sheng's avatar
wu-sheng 已提交
40 41 42 43
- 安装zookeeper 3.4.6
- 安装apache hbase 1.1.2
- 安装mysql
- 安装tomcat 7
wu-sheng's avatar
wu-sheng 已提交
44
- redis-3.0.5
wu-sheng's avatar
wu-sheng 已提交
45 46

### 编译安装SkyWalking Server
wu-sheng's avatar
wu-sheng 已提交
47 48 49 50 51 52 53 54 55
- 编译工程
```shell
$cd github/sky-walking/skywalking-server
$mvn package -Dmaven.test.skip=true
$cd github/sky-walking/skywalking-server/target/installer
```
- 拷贝installer到服务器
- 根据服务器环境修改/config/config.properties
```properties
wu-sheng's avatar
wu-sheng 已提交
56 57 58
#服务器收集数据监听端口
server.port=34000

wu-sheng's avatar
wu-sheng 已提交
59 60 61 62
#数据缓存文件目录,请确保此目录有一定的存储容量
buffer.data_buffer_file_parent_directory=D:/test-data/data/buffer
#偏移量注册文件的目录
registerpersistence.register_file_parent_directory=d:/test-data/data/offset
wu-sheng's avatar
wu-sheng 已提交
63

wu-sheng's avatar
wu-sheng 已提交
64 65 66 67 68 69 70 71
#hbase zk quorum
hbaseconfig.zk_hostname=10.1.235.197,10.1.235.198,10.1.235.199
#hbase zk port
hbaseconfig.client_port=29181

#Redis配置
alarm.redis_server=10.1.241.18:16379
```
wu-sheng's avatar
wu-sheng 已提交
72 73 74 75 76 77
- 启动服务
```shell
$cd installer/bin
$./swserver.sh
```
- 可根据需要部署多个实例
wu-sheng's avatar
wu-sheng 已提交
78
- 启动服务前,请注意hbase的客户端使用机器名而非ip连接主机,请在server所在机器上正确配置hosts文件,否则会造成数据无法入库
wu-sheng's avatar
wu-sheng 已提交
79 80

### 编译安装SkyWalking Alarm
wu-sheng's avatar
wu-sheng 已提交
81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111
- 编译工程
```shell
$cd github/sky-walking/skywalking-alarm
$mvn package -Dmaven.test.skip=true
$cd github/sky-walking/skywalking-alarm/target/installer
```
- 拷贝installer到服务器
- 根据服务器环境修改/config/config.properties
```properties
#zookeeper连接地址,用于协调集群,可以和hbase的zookeeper共用
zkpath.connect_str=10.1.241.18:29181,10.1.241.19:29181,10.1.241.20:29181

#管理数据库的JDBC连接信息
#数据库连接地址
db.url=jdbc:mysql://10.1.241.20:31306/sw_db
#数据库用户名
db.user_name=sw_dbusr01
#数据库密码
db.password=sw_dbusr01

#告警信息存在的redis服务器地址,需要和skywalking-server的alarm.redis_server设置一致
alarm.redis_server=127.0.0.1:6379
```
- 启动服务
```shell
$cd installer/bin
$./sw-alarm-server.sh
```
- 可根据需要部署多个实例,根据实例启动数量,自动负载均衡

### 编译安装SkyWalking WebUI
wu-sheng's avatar
wu-sheng 已提交
112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130
- 修改配置文件config.properties
```properties
#hbase的连接地址
hbaseconfig.quorum=10.1.235.197,10.1.235.198,10.1.235.199
hbaseconfig.client_port=29181
```
- 修改配置文件jdbc.properties
```properties
#管理数据库的JDBC连接信息
jdbc.url=jdbc:mysql://10.1.228.202:31316/test
jdbc.username=devrdbusr21
jdbc.password=devrdbusr21
```
- 编译工程
```shell
$cd github/sky-walking/skywalking-webui
$mvn package
```
- 初始化管理数据库
wu-sheng's avatar
wu-sheng 已提交
131
根据[数据库脚本](https://github.com/wu-sheng/sky-walking/blob/master/skywalking-webui/src/main/sql/table.mysql)初始化管理数据库。其中,脚本中如下SQL片段需要修改:
wu-sheng's avatar
wu-sheng 已提交
132 133 134 135 136
```sql
--配置告警邮件的发送人和SMTP信息
INSERT INTO `system_config` (`config_id`,`conf_key`,`conf_value`,`val_type`,`val_desc`,`create_time`,`sts`,`modify_time`) VALUES (1000,'mail_info','{\"mail.host\":\"mail.asiainfo.com\",\"mail.transport.protocol\":\"smtp\",\"mail.smtp.auth\":\"true\",\"mail.smtp.starttls.enable\":\"false\",\"mail.username\":\"testA\",\"mail.password\":\"******\",\"mail.account.prefix\":\"@asiainfo.com\"}','json','默认邮件发送人信息','2015-12-10 11:54:06','A','2015-12-10 11:54:06');
--配置部署页面地址,用于告警邮件内的链接
INSERT INTO `system_config` (`config_id`,`conf_key`,`conf_value`,`val_type`,`val_desc`,`create_time`,`sts`,`modify_time`) VALUES (1001,'portal_addr','http://10.1.235.197:48080/skywalking/','string','默认门户地址','2015-12-10 15:23:53','A','2015-12-10 15:23:53');
wu-sheng's avatar
wu-sheng 已提交
137
--配置SkyWalking Server的集群地址(内网地址)
wu-sheng's avatar
wu-sheng 已提交
138
INSERT INTO `system_config` (`config_id`,`conf_key`,`conf_value`,`val_type`,`val_desc`,`create_time`,`sts`,`modify_time`) VALUES (1002,'servers_addr','10.1.235.197:34000;10.1.235.197:35000;','string','日志采集地址','2015-12-10 15:23:53','A','2015-12-10 15:23:53');
wu-sheng's avatar
wu-sheng 已提交
139 140
--配置SkyWalking Server的集群地址(外网地址)
INSERT INTO `system_config` (`config_id`,`conf_key`,`conf_value`,`val_type`,`val_desc`,`create_time`,`sts`,`modify_time`) VALUES (1003,'servers_addr_1','60.194.3.183:34000;60.194.3.183:35000;60.194.3.184:34000;60.194.3.184:35000;','string','日志采集地址-外网','2015-12-10 15:23:53','A','2015-12-10 15:23:53');
wu-sheng's avatar
wu-sheng 已提交
141 142
```
- 上传war包到服务器,启动Tomcat服务器
wu-sheng's avatar
wu-sheng 已提交
143 144 145 146

### 编译安装SkyWalking Analysis
暂未提供

wu-sheng's avatar
wu-sheng 已提交
147
## 使用maven发布各插件工程
wu-sheng's avatar
wu-sheng 已提交
148 149 150 151 152
- 发布skywalking-sdk-plugin下的各子工程(dubbo-plugin,spring-plugin,web-plugin,jdbc-plugin,httpclient-4.2.x-plugin,httpclient-4.3.x-plugin)
- 请跳过maven.test环节,避免打包失败
```properties
-Dmaven.test.skip=true
```
wu-sheng's avatar
wu-sheng 已提交
153

154 155
## 引入核心SDK
无论试用哪种插件,都必须引入
wu-sheng's avatar
wu-sheng 已提交
156
```xml
wu-sheng's avatar
wu-sheng 已提交
157
<!-- API日志输出,客户端可指定所需的log4j2版本 -->
wu-sheng's avatar
wu-sheng 已提交
158
<!-- 2.4.1为开发过程所选用版本 -->
wu-sheng's avatar
wu-sheng 已提交
159 160 161 162 163
<dependency>
    <groupId>org.apache.logging.log4j</groupId>
    <artifactId>log4j-core</artifactId>
    <version>2.4.1</version>
</dependency>
wu-sheng's avatar
wu-sheng 已提交
164 165 166 167 168 169
<!-- 监控api,可监控插件不支持的调用 -->
<dependency>
    <groupId>com.ai.cloud</groupId>
    <artifactId>skywalking-api</artifactId>
    <version>1.0-SNAPSHOT</version>
</dependency>
wu-sheng's avatar
wu-sheng 已提交
170 171
```

wu-sheng's avatar
wu-sheng 已提交
172
## 根据所需插件,配置应用程序
173 174
- 参考[SDK用户指南](https://github.com/wu-sheng/sky-walking/tree/master/skywalking-sdk-plugin)
- 注意:插件不会引用所需的第三方组件(如Spring、dubbo、dubbox等),请自行引入所需的版本。
wu-sheng's avatar
wu-sheng 已提交
175

176

wu-sheng's avatar
wu-sheng 已提交
177
## 下载并设置授权文件
wu-sheng's avatar
wu-sheng 已提交
178 179
- 注册并登陆过skywalking-webui,创建应用。(一个用户代表一个逻辑集群,一个应用代表一个服务集群。如前后端应用应该设置两个应用,但归属一个用户)
- 下载授权文件,并在运行时环境中,将授权文件加入到CLASSPATH中
wu-sheng's avatar
wu-sheng 已提交
180 181

## 在运行时环境中设置环境变量
wu-sheng's avatar
wu-sheng 已提交
182
```
wu-sheng's avatar
wu-sheng 已提交
183
export SKYWALKING_RUN=true
wu-sheng's avatar
wu-sheng 已提交
184 185 186
```
- 设置完成后,可以在当前环境中启动业务应用系统

wu-sheng's avatar
wu-sheng 已提交
187
## 通过扩展log4j或log4j2,在应用日志中,显示trace-id
wu-sheng's avatar
wu-sheng 已提交
188 189
### log4j
- 编译并发布skywalking-log/log4j-1.x-plugin
wu-sheng's avatar
wu-sheng 已提交
190 191 192 193 194 195
```xml
<dependency>
    <groupId>com.ai.cloud</groupId>
    <artifactId>skywalking-log4j-1.x-plugin</artifactId>
    <version>1.0-SNAPSHOT</version>
</dependency>
wu-sheng's avatar
wu-sheng 已提交
196 197 198 199 200 201 202 203 204 205 206 207
```
- 配置log4j配置文件
```properties
log4j.appender.A1.layout=com.ai.cloud.skywalking.plugin.log.log4j.v1.x.TraceIdPatternLayout
#%x为traceid的转义符
log4j.appender.A1.layout.ConversionPattern=[%x] %-d{yyyy-MM-dd HH:mm:ss.SSS} %c %n[%p] %n%m%n
```

### log4j2
- 编译并发布skywalking-log/log4j-2.x-plugin
- 引用所需的日志插件
```xml
wu-sheng's avatar
wu-sheng 已提交
208 209 210 211 212 213
<dependency>
    <groupId>com.ai.cloud</groupId>
    <artifactId>skywalking-log4j-2.x-plugin</artifactId>
    <version>1.0-SNAPSHOT</version>
</dependency>
```
wu-sheng's avatar
wu-sheng 已提交
214 215 216 217 218 219
- 配置log4j2配置文件
```xml
<!--%tid为traceid的转义符-->
<PatternLayout  pattern="%d{HH:mm:ss.SSS} [%tid] [%t] %-5level %logger{36} - %msg%n"/>
```

wu-sheng's avatar
wu-sheng 已提交
220 221 222 223 224 225 226
- 日志示例
```
#tid:N/A,代表环境设置不正确或监控已经关闭
#tid: ,代表测试当前访问不在监控范围
#tid:1.0a2.1453065000002.c3f8779.27878.30.184,标识此次访问的tid信息,示例如下
[DEBUG] Returning handler method [public org.springframework.web.servlet.ModelAndView com.ai.cloud.skywalking.example.controller.OrderSaveController.save(javax.servlet.http.HttpServletRequest)] TID:1.0a2.1453192613272.2e0c63e.11144.58.1 2016-01-19 16:36:53.288 org.springframework.beans.factory.support.DefaultListableBeanFactory 
```
wu-sheng's avatar
wu-sheng 已提交
227

wu-sheng's avatar
wu-sheng 已提交
228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243
## 如何在追踪日志中记录日志上下文
- 使用sky walking提供的专用API,可以将日志保存到追踪日志中。示例如下:
```java
String businessKey = "phoneNumber:" + phoneNumber + ",resourceId:" + resourceId + ",mail:" + mail;
BusinessKeyAppender.setBusinessKey2Trace(businessKey);
```

## 如何在代码中获取traceid
- 通过API获取traceid
```java
Tracing.getTraceId();
```

## 还有其他方式获取traceid么?
- 通过web应用的http调用入口,通过返回的header信息,找到此次调用的traceid。前提:此web应用的url,已经使用skywalking进行监控。

wu-sheng's avatar
wu-sheng 已提交
244
# 源代码说明
wu-sheng's avatar
wu-sheng 已提交
245
* [HBase存储结构说明](https://github.com/wu-sheng/sky-walking/blob/master/skywalking-server/doc/hbase_table_desc.md)