YARN 时间线服务器

概述

简介

YARN 中通过时间线服务器以通用方式存储和检索应用程序的当前和历史信息。它有两项职责

持久化应用程序特定信息

收集和检索完全特定于应用程序或框架的信息。例如,Hadoop MapReduce 框架可以包括诸如映射任务数、缩减任务数、计数器等信息。应用程序开发人员可以通过应用程序主控和/或应用程序容器中的 TimelineClient 将特定信息发布到时间线服务器。

然后可以通过 REST API 查询此信息,以便应用程序/框架特定 UI 呈现。

持久化有关已完成应用程序的通用信息

以前,应用程序历史服务器仅为 MapReduce 作业提供此支持。随着时间线服务器的引入,应用程序历史服务器成为时间线服务器的一种用途。

通用信息包括应用程序级别数据,例如

  • 队列名称,
  • ApplicationSubmissionContext 中设置的用户信息等,
  • 为应用程序运行的应用程序尝试列表
  • 有关每个应用程序尝试的信息
  • 在每个应用程序尝试下运行的容器列表
  • 每个容器的信息。

通用数据由 YARN 资源管理器发布到时间线存储,并由其 Web UI 用于显示有关已完成应用程序的信息。

当前状态和未来计划

当前状态

  1. 时间线服务器的核心功能已完成。
  2. 它可在安全和非安全集群中工作。
  3. 通用历史服务建立在时间线存储之上。
  4. 历史记录可以存储在内存中或存储在 leveldb 数据库中;后者确保在时间线服务器重新启动后保留历史记录。
  5. 不支持在 YARN 中安装特定于框架的 UI。
  6. 特定于应用程序的信息只能通过使用 JSON 类型内容的 RESTful API 获得。
  7. “时间线服务器 v1”REST API 已被声明为在未来版本中将保持其兼容性的 REST API 之一。
  8. 时间线服务器的单服务器实现限制了服务的可扩展性;它还阻止该服务成为 YARN 基础设施的高可用性组件。

未来计划

  1. 未来版本将引入一个可扩展且可靠的新一代时间线服务,“时间线服务 v2”
  2. 此服务扩展的功能可能对使用时间线服务器 v1 REST API 的应用程序不可用。其中包括扩展的数据结构以及客户端在时间线服务器实例之间进行故障转移的能力。

时间线结构

Timeline Structure

时间线域

时间线域为时间线服务器提供一个命名空间,允许用户托管多个实体,将它们与其他用户和应用程序隔离。时间线服务器安全性在此级别定义。

“域”主要存储所有者信息、读和写 ACL 信息、创建和修改时间戳信息。每个域由一个 ID 标识,该 ID 在 YARN 集群中的所有用户之间必须是唯一的。

时间线实体

时间线实体包含概念实体及其相关事件的元信息。

该实体可以是应用程序、应用程序尝试、容器或任何用户定义的对象。

它包含主要筛选器,该筛选器将用于索引时间线存储中的实体。因此,用户/应用程序应仔细选择他们希望存储为主要筛选器的信息。

剩余数据可以存储为未编制索引的信息。每个实体都由一个 EntityIdEntityType 唯一标识。

时间线事件

时间线事件描述了一个与应用程序的特定时间线实体相关的事件。

用户可以自由定义事件的含义,例如启动应用程序、分配容器、操作失败或其他对用户和集群操作员来说相关的信息。

部署

配置

基本配置

配置属性 说明
yarn.timeline-service.enabled 在服务器端,它指示时间线服务是否启用。在客户端,用户可以启用它来指示客户端是否要使用时间线服务。如果在客户端启用它并启用安全,则 yarn 客户端会尝试获取时间线服务器的委派令牌。默认为 false
yarn.resourcemanager.system-metrics-publisher.enabled 控制 RM 是否在时间线服务器上发布 YARN 系统指标的设置。默认为 false
yarn.timeline-service.generic-application-history.enabled 指示客户端是否从时间线历史服务查询通用应用程序数据。如果未启用,则仅从资源管理器查询应用程序数据。默认为 false

时间线存储和状态存储配置

配置属性 说明
yarn.timeline-service.store-class 时间线存储的存储类名称。默认为 org.apache.hadoop.yarn.server.timeline.LeveldbTimelineStore
yarn.timeline-service.leveldb-timeline-store.path Leveldb 时间线存储的存储文件名。默认为 ${hadoop.tmp.dir}/yarn/timeline
yarn.timeline-service.leveldb-timeline-store.ttl-interval-ms Leveldb 时间线存储的删除周期之间的等待时间(以毫秒为单位)。默认为 300000
yarn.timeline-service.leveldb-timeline-store.read-cache-size Leveldb 时间线存储的未压缩块的读取缓存大小(以字节为单位)。默认为 104857600
yarn.timeline-service.leveldb-timeline-store.start-time-read-cache-size Leveldb 时间线存储的最近读取实体开始时间的缓存大小(以实体数为单位)。默认为 10000
yarn.timeline-service.leveldb-timeline-store.start-time-write-cache-size Leveldb 时间线存储的最近写入实体开始时间的缓存大小(以实体数为单位)。默认为 10000
yarn.timeline-service.recovery.enabled 默认为 false
yarn.timeline-service.state-store-class 时间线状态存储的存储类名称。默认为 org.apache.hadoop.yarn.server.timeline.recovery.LeveldbTimelineStateStore
yarn.timeline-service.leveldb-state-store.path Leveldb 时间线状态存储的存储文件名。

Web 和 RPC 配置

配置属性 说明
yarn.timeline-service.hostname Timeline 服务 Web 应用程序的主机名。默认为 0.0.0.0
yarn.timeline-service.address Timeline 服务器启动 RPC 服务器的地址。默认为 ${yarn.timeline-service.hostname}:10200
yarn.timeline-service.webapp.address Timeline 服务 Web 应用程序的 http 地址。默认为 ${yarn.timeline-service.hostname}:8188
yarn.timeline-service.webapp.https.address Timeline 服务 Web 应用程序的 https 地址。默认为 ${yarn.timeline-service.hostname}:8190
yarn.timeline-service.bind-host 服务器将绑定的实际地址。如果设置了此可选地址,RPC 和 Webapp 服务器将绑定到此地址以及分别在 yarn.timeline-service.addressyarn.timeline-service.webapp.address 中指定的端口。这对于通过将设置设为 0.0.0.0 使服务侦听所有接口非常有用。
yarn.timeline-service.http-cross-origin.enabled 为需要跨域 Web 响应头的 Web 服务启用跨域支持 (CORS)。例如,javascript 向 Timeline 服务器发出 Web 服务请求。默认为 false
yarn.timeline-service.http-cross-origin.allowed-origins 允许的来源的逗号分隔列表。以 regex: 为前缀的值将解释为正则表达式。也可能包含通配符 (*) 的值,这里将生成一个正则表达式,不鼓励使用,并且仅为向后兼容性提供支持。默认为 *
yarn.timeline-service.http-cross-origin.allowed-methods 需要跨域 (CORS) 支持的 Web 服务允许的方法的逗号分隔列表。默认为 GET,POST,HEAD
yarn.timeline-service.http-cross-origin.allowed-headers 需要跨域 (CORS) 支持的 Web 服务允许的标头的逗号分隔列表。默认为 X-Requested-With,Content-Type,Accept,Origin
yarn.timeline-service.http-cross-origin.max-age 需要跨域 (CORS) 支持的 Web 服务可以缓存预检请求的秒数。默认为 1800

请注意,在 TimelineClient 中根据 YARN 范围配置选项 yarn.http.policy 的值来选择 HTTP 和 HTTPS 绑定;如果此策略为 HTTPS_ONLY,则将选择 HTTPS 端点。

高级服务器端配置

配置属性 说明
yarn.timeline-service.ttl-enable 启用删除 Timeline 存储中的过期数据。默认为 true
yarn.timeline-service.ttl-ms Timeline 存储数据的生存期(以毫秒为单位)。默认为 604800000(7 天)。
yarn.timeline-service.handler-thread-count 处理客户端 RPC 请求的处理程序线程数。默认为 10
yarn.timeline-service.client.max-retries 尝试将数据发布到时间线服务的最大重试次数。默认为 30
yarn.timeline-service.client.retry-interval-ms 时间线服务客户端重试之间的毫秒数间隔。默认为 1000
yarn.timeline-service.generic-application-history.max-applications 使用 REST API 或应用程序历史记录协议可以获取的最大应用程序数,并显示在时间线服务器 Web UI 中。默认为 10000

UI 托管配置

如果启用,时间线服务可以托管多个 UI。该服务可以同时支持托管在目录中或捆绑的 war 文件中的静态网站。然后,Web UI 将托管在配置路径下的时间线服务 HTTP 端口上。

配置属性 说明
yarn.timeline-service.ui-names 将托管的 UI 的逗号分隔列表。默认为 none
yarn.timeline-service.ui-on-disk-path.$name 对于每个 ui-names,应为目录服务静态内容或 Web 存档(war 文件)的位置指定一个磁盘路径。
yarn.timeline-service.ui-web-path.$name 对于每个 ui-names,应相对于时间线服务器根目录指定 Web 路径。路径应以起始斜杠开头。

安全配置

可以通过将 yarn.timeline-service.http-authentication.type 设置为 kerberos 来启用安全性,之后以下配置选项可用

配置属性 说明
yarn.timeline-service.http-authentication.type 定义用于时间线服务器 HTTP 端点的身份验证。支持的值为:simple / kerberos / #AUTHENTICATION_HANDLER_CLASSNAME#。默认为 simple
yarn.timeline-service.http-authentication.simple.anonymous.allowed 指示在使用“简单”身份验证时,时间线服务器是否允许匿名请求。默认为 true
yarn.timeline-service.principal 时间线服务器的 Kerberos 主体。
yarn.timeline-service.keytab 时间线服务器的 Kerberos 密钥表。在 Unix 上默认为 /etc/krb5.keytab
yarn.timeline-service.delegation.key.update-interval 默认为 86400000(1 天)。
yarn.timeline-service.delegation.token.renew-interval 默认为 86400000(1 天)。
yarn.timeline-service.delegation.token.max-lifetime 默认为 604800000(7 天)。
yarn.timeline-service.client.best-effort 获取委派令牌的失败是否应被视为应用程序故障(选项 = false),或者客户端是否应尝试继续在没有令牌的情况下发布信息(选项 = true)。默认值:false

启用时间线服务和通用历史记录服务

以下是启动时间线服务器的基本配置。

<property>
  <description>Indicate to clients whether Timeline service is enabled or not.
  If enabled, the TimelineClient library used by end-users will post entities
  and events to the Timeline server.</description>
  <name>yarn.timeline-service.enabled</name>
  <value>true</value>
</property>

<property>
  <description>The setting that controls whether yarn system metrics is
  published on the timeline server or not by RM.</description>
  <name>yarn.resourcemanager.system-metrics-publisher.enabled</name>
  <value>true</value>
</property>

<property>
  <description>Indicate to clients whether to query generic application
  data from timeline history-service or not. If not enabled then application
  data is queried only from Resource Manager.</description>
  <name>yarn.timeline-service.generic-application-history.enabled</name>
  <value>true</value>
</property>

运行时间线服务器

假设所有上述配置都设置正确,管理员可以使用以下命令启动时间线服务器/历史记录服务

yarn timelineserver

要以守护程序身份启动时间线服务器/历史记录服务,命令为

$HADOOP_YARN_HOME/sbin/yarn-daemon.sh start timelineserver

通过命令行访问通用数据

用户可以通过以下命令行访问应用程序的通用历史数据

$ yarn application -status <Application ID>
$ yarn applicationattempt -list <Application ID>
$ yarn applicationattempt -status <Application Attempt ID>
$ yarn container -list <Application Attempt ID>
$ yarn container -status <Container ID>

请注意,可以使用相同的命令来获取有关正在运行的应用程序的相应信息。

发布特定于应用程序的数据

开发人员可以通过构建 TimelineEntityTimelineEvent 对象,然后通过 TimelineClient API 将实体和事件发布到时间线服务器,来定义他们希望为其应用程序记录哪些信息。

以下是一个示例

// Create and start the Timeline client
TimelineClient client = TimelineClient.createTimelineClient();
client.init(conf);
client.start();

try {
  TimelineDomain myDomain = new TimelineDomain();
  myDomain.setId("MyDomain");
  // Compose other Domain info ....

  client.putDomain(myDomain);

  TimelineEntity myEntity = new TimelineEntity();
  myEntity.setDomainId(myDomain.getId());
  myEntity.setEntityType("APPLICATION");
  myEntity.setEntityId("MyApp1");
  // Compose other entity info

  TimelinePutResponse response = client.putEntities(entity);

  TimelineEvent event = new TimelineEvent();
  event.setEventType("APP_FINISHED");
  event.setTimestamp(System.currentTimeMillis());
  event.addEventInfo("Exit Status", "SUCCESS");
  // Compose other Event info ....

  myEntity.addEvent(event);
  TimelinePutResponse response = timelineClient.putEntities(entity);

} catch (IOException e) {
  // Handle the exception
} catch (RuntimeException e) {
  // In Hadoop 2.6, if attempts submit information to the Timeline Server fail more than the retry limit,
  // a RuntimeException will be raised. This may change in future releases, being
  // replaced with a IOException that is (or wraps) that which triggered retry failures.
} catch (YarnException e) {
  // Handle the exception
} finally {
  // Stop the Timeline client
  client.stop();
}
  1. 将数据发布到时间线服务器是一个同步操作;只有在成功后,调用才会返回。
  2. TimelineClient 实现类是 YARN Service API 的子类;它可以放在 CompositeService 下,以简化其生命周期管理。
  3. putEntities() 调用的结果是 TimelinePutResponse 对象。它包含时间线服务器拒绝的那些时间线实体的(希望是空的)列表,以及指示每个故障原因的错误代码。

在 Hadoop 2.6 和 2.7 中,错误代码为

错误代码 说明
1 没有开始时间
2 IOException
3 系统过滤器冲突(使用了保留的过滤器键)
4 访问被拒绝
5 没有域
6 禁止关系

将来可能会定义更多错误代码。

注意:以下是更新实体时需要观察的要点。

  • 不应该修改已存在实体的域 ID。
  • 修改主过滤器值后,新值将附加到旧值;不会替换原始值。
  • 建议对实体的所有更新使用相同的主过滤器。在更新中通过主过滤器进行任何修改都将导致使用更新后的主过滤器进行查询无法获取更新之前的信息

通用数据 Web UI

用户可以通过 Web UI 访问应用程序的通用历史信息

http(s)://<timeline server http(s) address:port>/applicationhistory

时间线服务器 REST API V1

当前仅通过 REST API 调用支持查询时间线服务器;YARN 库中未实现 API 客户端。在 Java 中,Jersey 客户端可有效查询服务器,即使在安全模式下(前提是调用方具有适当的 Kerberos 令牌或密钥表)。

v1 REST API 在时间线服务器 Web 服务的路径 /ws/v1/timeline/ 下实现。

以下是 API 的非规范性说明。

根路径

GET /ws/v1/timeline/

返回描述服务器实例和版本信息的 JSON 对象。

 {
   About: "Timeline API",
   timeline-service-version: "3.0.0-SNAPSHOT",
   timeline-service-build-version: "3.0.0-SNAPSHOT from fcd0702c10ce574b887280476aba63d6682d5271 by zshen source checksum e9ec74ea3ff7bc9f3d35e9cac694fb",
   timeline-service-version-built-on: "2015-05-13T19:45Z",
   hadoop-version: "3.0.0-SNAPSHOT",
   hadoop-build-version: "3.0.0-SNAPSHOT from fcd0702c10ce574b887280476aba63d6682d5271 by zshen source checksum 95874b192923b43cdb96a6e483afd60",
   hadoop-version-built-on: "2015-05-13T19:44Z"
 }

/ws/v1/timeline/domain

域摘要信息 /ws/v1/timeline/domain

GET /ws/v1/timeline/domain?owner=$OWNER

以 JSON 编组的 TimelineDomains 数据结构返回属于特定用户的域列表。

未经身份验证的 GET 必须设置 owner

在经过身份验证的请求中,owner 默认为调用方。

PUT /ws/v1/timeline/domain

将序列化的 TimelineDomain 结构 PUT 到此路径将把该域添加到指定/当前用户拥有的域列表中。成功操作返回状态代码 200 和不包含任何错误的 TimelinePutResponse

有关域的特定信息 /ws/v1/timeline/domain/{domainId}

返回描述域的 JSON 编组 TimelineDomain 结构。

如果未找到该域,则返回 HTTP 404 响应。

POST 新域 /ws/v1/timeline/domain

创建新时间线域或覆盖现有域。

尝试创建新域时,提交中的 ID 在群集中的所有域中必须是唯一的。

尝试更新现有域时,必须设置该域的 ID。提交者必须具有更新该域的适当权限。

提交:TimelineDomain

响应:TimelinePutResponse

列出用户的域:GET /ws/v1/timeline/domain

检索用户的全部域列表。

如果指定了所有者,该所有者名称将覆盖调用者的名称。

查询参数 说明
所有者 要列出的域的所有者
GET https://127.0.0.1:8188/ws/v1/timeline/domain?owner=alice

{
"domains":
  [
    {
    "id":"DS_DOMAIN_2",
    "owner":"alice",
    "readers":"peter",
    "writers":"john",
    "createdtime":1430425000337,
    "modifiedtime":1430425000337
    },
    {
    "id":"DS_DOMAIN_1",
    "owner":"alice",
    "readers":"bar",
    "writers":"foo",
    "createdtime":1430424955963,
    "modifiedtime":1430424955963
    }
    ,
    {"id":"DEFAULT",
    "description":"System Default Domain",
    "owner":"alice",
    "readers":"*",
    "writers":"*",
    "createdtime":1430424022699,
    "modifiedtime":1430424022699
    }
  ]
}

响应:TimelineDomains

如果用户没有列出指定所有者域的权限,则返回不包含域列表的TimelineDomains响应。

检索特定域的详细信息:GET /ws/v1/timeline/domain/{domainId}

检索单个域的详细信息

GET https://127.0.0.1:8188/ws/v1/timeline/domain/DS_DOMAIN_1

响应:TimelineDomain

{
  "id":"DS_DOMAIN_1",
  "owner":"zshen",
  "readers":"bar",
  "writers":"foo",
  "createdtime":1430424955963,
  "modifiedtime":1430424955963
}

如果用户没有查询该域详细信息的权限,则返回 404,未找到异常——如果不存在具有该 ID 的条目,则返回相同的响应。

发布时间线实体

使用发布实体 API,您可以将实体和事件(包含您要记录的每个框架信息)发布到时间线服务器。

URI

http(s)://<timeline server http(s) address:port>/ws/v1/timeline

支持的 HTTP 操作

POST

支持的查询参数

响应:TimelinePutResponse

请求示例

JSON 请求

HTTP 请求

POST http://<timeline server http address:port>/ws/v1/timeline

请求标头

POST /ws/v1/timeline HTTP/1.1
Accept: application/json
Content-Type: application/json
Transfer-Encoding: chunked

请求正文

{
  "entities" : [ {
    "entity" : "entity id 0",
    "entitytype" : "entity type 0",
    "relatedentities" : {
      "test ref type 2" : [ "test ref id 2" ],
      "test ref type 1" : [ "test ref id 1" ]
    },
    "events" : [ {
      "timestamp" : 1395818851590,
      "eventtype" : "event type 0",
      "eventinfo" : {
        "key2" : "val2",
        "key1" : "val1"
      }
    }, {
      "timestamp" : 1395818851590,
      "eventtype" : "event type 1",
      "eventinfo" : {
        "key2" : "val2",
        "key1" : "val1"
      }
    } ],
    "primaryfilters" : {
      "pkey2" : [ "pval2" ],
      "pkey1" : [ "pval1" ]
    },
    "otherinfo" : {
      "okey2" : "oval2",
      "okey1" : "oval1"
    },
    "starttime" : 1395818851588
  }, {
    "entity" : "entity id 1",
    "entitytype" : "entity type 0",
    "relatedentities" : {
      "test ref type 2" : [ "test ref id 2" ],
      "test ref type 1" : [ "test ref id 1" ]
    },
    "events" : [ {
      "timestamp" : 1395818851590,
      "eventtype" : "event type 0",
      "eventinfo" : {
        "key2" : "val2",
        "key1" : "val1"
      }
    }, {
      "timestamp" : 1395818851590,
      "eventtype" : "event type 1",
      "eventinfo" : {
        "key2" : "val2",
        "key1" : "val1"
      }
    } ],
    "primaryfilters" : {
      "pkey2" : [ "pval2" ],
      "pkey1" : [ "pval1" ]
    },
    "otherinfo" : {
      "okey2" : "oval2",
      "okey1" : "oval1"
    },
    "starttime" : 1395818851590
  } ]
}

必需字段

实体:typeidstarttime 是必需的,除非实体包含一个或多个事件)。事件:typetimestamp

时间线实体列表

使用时间线实体列表 API,您可以检索实体对象列表,按实体的开始时间戳降序排列。实体的开始时间戳可以是应用程序指定的某个时间戳。如果没有明确指定,则存储会将其选为实体的第一个帖子中接收到的事件的最早时间戳。

URI

使用以下 URI 获取给定entityType的所有实体对象。

http(s)://<timeline server http(s) address:port>/ws/v1/timeline/{entityType}

支持的 HTTP 操作

GET

支持的查询参数

  1. limit - 要返回的实体数量限制。如果为 null,则默认为 100。
  2. windowStart - 要检索的最早开始时间戳(不包括)。如果为 null,则默认为检索所有实体,直到达到限制。
  3. windowEnd - 要检索的最晚开始时间戳(包括)。如果为 null,则默认为 Long 的最大值。
  4. fromId - 如果 fromId 不为 null,则检索早于或等于指定 ID 的实体。如果未找到指定 ID 的开始时间,则将返回一个空的实体列表。如果此实体的开始时间晚于 windowEnd,则 windowEnd 参数将优先。
  5. fromTs - 如果 fromTs 不为 null,则忽略在给定时间戳之后插入到存储中的实体。用于此比较的实体插入时间戳是收到实体的第一个 put 时存储的系统时间(而不是实体的开始时间)。
  6. primaryFilter - 仅检索具有指定主过滤器的实体。如果为 null,则检索所有实体。这是一次索引检索,不会扫描与过滤器不匹配的实体。
  7. secondaryFilters - 仅检索在主过滤器或其他信息中与所有指定过滤器完全匹配的实体。这不是索引检索,因此会扫描所有实体,但仅返回与过滤器匹配的实体。
  8. fields - 指定要检索的实体对象的哪些字段:EVENTSRELATED_ENTITIESPRIMARY_FILTERSOTHER_INFOLAST_EVENT_ONLY。如果字段集合包含 LAST_EVENT_ONLY 而不包含 EVENTS,则检索每个实体的最新事件。如果为 null,则检索所有字段。

请注意,primaryFiltersecondaryFilters 参数的关键/值对的值可以是不同的数据类型,并且匹配对数据类型敏感。用户需要正确设置值格式。例如,123"123" 分别表示整数和字符串。如果实体的主过滤器为字符串 "123",但参数设置为整数 123,则不会匹配该实体。类似地,true 表示布尔值,而 "true" 表示字符串。通常,值将被强制转换为特定 Java 类型,与 jackson 库解析 JSON 片段一致。

entities(时间线实体列表)对象的元素

当您请求时间线实体列表时,信息将作为容器对象的集合返回。另请参阅时间线实体以了解时间线实体对象的语法。

项目 数据类型 说明
entities 时间线实体对象数组 (JSON) 时间线实体对象的集合

响应示例

JSON 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/timeline/DS_APP_ATTEMPT

响应标头

HTTP/1.1 200 OK
Content-Type: application/json
Transfer-Encoding: chunked

响应正文

{
  "entities":[
  {
  "entitytype":"DS_APP_ATTEMPT",
  "entity":"appattempt_1430424020775_0004_000001",
  "events":[
    {
    "timestamp":1430425008796,
    "eventtype":"DS_APP_ATTEMPT_END",
    "eventinfo": { }
    }
    {
    "timestamp":1430425004161,
    "eventtype":"DS_APP_ATTEMPT_START",
    "eventinfo": { }
    }
  ]
  "starttime":1430425004161,
  "domain":"DS_DOMAIN_2",
  "relatedentities": { },
  "primaryfilters":
    {
    "user":["zshen"]
    },
  "otherinfo": { }
  }
  {
  "entitytype":"DS_APP_ATTEMPT",
  "entity":"appattempt_1430424020775_0003_000001",
  "starttime":1430424959169,
  "domain":"DS_DOMAIN_1",
  "events":[
    {
    "timestamp":1430424963836,
    "eventinfo": { }
     }
    {
    "timestamp":1430424959169,
    "eventinfo": { }
    }
   ]
  "relatedentities": { },
  "primaryfilters": {
    "user":["zshen"]
   },
  "otherinfo": { }
   }
  ]
}

时间线实体

借助时间线实体 API,您可以检索给定实体标识符的实体信息。

URI

使用以下 URI 获取由 entityType 值和 entityId 值标识的实体对象。

http(s)://<timeline server http(s) address:port>/ws/v1/timeline/{entityType}/{entityId}

支持的 HTTP 操作

GET

支持的查询参数

  1. fields - 指定要检索的实体对象的哪些字段:EVENTSRELATED_ENTITIESPRIMARY_FILTERSOTHER_INFOLAST_EVENT_ONLY。如果字段集包含 LAST_EVENT_ONLY 且不包含 EVENTS,则会检索每个实体的最新事件。如果为 null,则检索所有字段。

entity(时间线实体)对象的元素

另请参阅时间线事件列表以了解时间线事件对象的语法。请注意,primaryfiltersotherinfovalue 是对象,而不是字符串。

项目 数据类型 说明
entity 字符串 实体 ID
entitytype 字符串 实体类型
relatedentities 映射 相关实体的标识符,按 entityType : [entity1, entity2, …] 映射组织
events 列表 实体的事件
primaryfilters 映射 实体的主要过滤器,按 key : [value1, value2, …] 映射组织
otherinfo 映射 实体的其他信息,按 key : value 映射组织
starttime 长整数 实体的开始时间

响应示例

JSON 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/timeline/DS_APP_ATTEMPT/appattempt_1430424020775_0003_000001

响应标头

HTTP/1.1 200 OK
Content-Type: application/json
Transfer-Encoding: chunked

响应正文

{
  "events":[
    {
    "timestamp":1430424959169,
    "eventtype":"DS_APP_ATTEMPT_START",
    "eventinfo":  {}}],
    "entitytype":"DS_APP_ATTEMPT",
    "entity":"appattempt_1430424020775_0003_000001",
    "starttime":1430424959169,
    "domain":"DS_DOMAIN_1",
    "relatedentities":  {},
    "primaryfilters":  {
        "user":["zshen"]
        },
    "otherinfo":  {}
    }
  ]
}

时间线事件列表

借助时间线事件 API,您可以检索所有同一实体类型的一系列实体的事件对象。每个实体的事件按其时间戳降序排列。

URI

使用以下 URI 获取给定 entityType 的事件对象。

http(s)://<timeline server http(s) address:port>/ws/v1/timeline/{entityType}/events

支持的 HTTP 操作

GET

支持的查询参数

  1. entityId - 要检索其事件的实体 ID。如果为 null,则不会返回任何事件。多个 entityId 可以用逗号分隔的值给出。
  2. limit - 对每个实体返回的事件数量的限制。如果为 null,则默认为每个实体 100 个事件。
  3. windowStart - 如果不为 null,则仅检索晚于给定时间(不包括)的事件
  4. windowEnd - 如果不为空,则仅检索早于给定时间(包括)的事件
  5. eventType - 将返回的事件限制为给定的类型。如果为 null,则将返回所有类型的事件。可以将多个 eventTypes 指定为逗号分隔的值。

events(时间线实体列表)对象的元素

当您请求时间线事件列表时,信息将作为事件对象集合返回。

项目 数据类型 说明
events 时间线事件对象数组 (JSON) 时间线事件对象集合

以下是单个事件对象的元素。请注意,eventinfootherinfovalue 是对象,而不是字符串。

项目 数据类型 说明
eventtype 字符串 事件类型
eventinfo 映射 事件信息,以 key : value 映射组织
timestamp 长整数 事件的时间戳

响应示例

JSON 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/timeline/DS_APP_ATTEMPT/events?entityId=appattempt_1430424020775_0003_000001

响应标头

HTTP/1.1 200 OK
Content-Type: application/json
Transfer-Encoding: chunked

响应正文

{
"events": [
  {
  "entity":"appattempt_1430424020775_0003_000001",
  "entitytype":"DS_APP_ATTEMPT"}
  "events":[
    {
    "timestamp":1430424963836,
    "eventtype":"DS_APP_ATTEMPT_END",
    "eventinfo":{}},
    {
    "timestamp":1430424959169,
    "eventtype":"DS_APP_ATTEMPT_START",
    "eventinfo":{}}
    ],
   }
  ]
}

通用数据 REST API

用户可以通过 REST API 访问应用程序的通用历史信息。

关于

使用 about API,您可以获取包含通用历史 REST API 描述和版本信息的时间线资源。

它本质上是 YARN TimelineAbout 结构的 XML/JSON 序列化形式。

URI

使用以下 URI 获取时间线 about 对象。

http(s)://<timeline server http(s) address:port>/ws/v1/applicationhistory/about

支持的 HTTP 操作

GET

支持的查询参数

about(应用程序)对象的元素

项目 数据类型 说明
关于 字符串 服务的描述
timeline-service-version 字符串 时间线服务版本
timeline-service-build-version 字符串 时间线服务构建版本
timeline-service-version-built-on 字符串 时间线服务构建时间
hadoop-version 字符串 Hadoop 版本
hadoop-build-version 字符串 Hadoop 构建版本
hadoop-version-built-on 字符串 Hadoop 构建时间

响应示例

JSON 响应

HTTP 请求

https://127.0.0.1:8188/ws/v1/applicationhistory/about

响应标头

HTTP/1.1 200 OK
Content-Type: application/json
Transfer-Encoding: chunked

响应正文

{
  About: "Generic History Service API",
  timeline-service-version: "3.0.0-SNAPSHOT",
  timeline-service-build-version: "3.0.0-SNAPSHOT from fcd0702c10ce574b887280476aba63d6682d5271 by zshen source checksum e9ec74ea3ff7bc9f3d35e9cac694fb",
  timeline-service-version-built-on: "2015-05-13T19:45Z",
  hadoop-version: "3.0.0-SNAPSHOT",
  hadoop-build-version: "3.0.0-SNAPSHOT from fcd0702c10ce574b887280476aba63d6682d5271 by zshen source checksum 95874b192923b43cdb96a6e483afd60",
  hadoop-version-built-on: "2015-05-13T19:44Z"
}

XML 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/applicationhistory/about
Accept: application/xml

响应标头

HTTP/1.1 200 OK
Content-Type: application/xml
Content-Length: 748

响应正文

 <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
 <about>
   <About>Generic History Service API</About>
   <hadoop-build-version>3.0.0-SNAPSHOT from fcd0702c10ce574b887280476aba63d6682d5271 by zshen source checksum 95874b192923b43cdb96a6e483afd60</hadoop-build-version>
   <hadoop-version>3.0.0-SNAPSHOT</hadoop-version>
   <hadoop-version-built-on>2015-05-13T19:44Z</hadoop-version-built-on>
   <timeline-service-build-version>3.0.0-SNAPSHOT from fcd0702c10ce574b887280476aba63d6682d5271 by zshen source checksum e9ec74ea3ff7bc9f3d35e9cac694fb</timeline-service-build-version>
   <timeline-service-version>3.0.0-SNAPSHOT</timeline-service-version>
   <timeline-service-version-built-on>2015-05-13T19:45Z</timeline-service-version-built-on>
 </about>

应用程序列表

使用应用程序列表 API,您可以获取资源集合,每个资源都代表一个应用程序。当您对此资源运行 GET 操作时,您将获得一个应用程序对象集合。

URI

http(s)://<timeline server http(s) address:port>/ws/v1/applicationhistory/apps

支持的 HTTP 操作

GET

支持的查询参数

  1. states - 匹配给定应用程序状态的应用程序,指定为逗号分隔的列表

  2. finalStatus - 应用程序的最终状态 - 由应用程序本身报告

  3. user - 用户名

  4. queue - 队列名称

  5. limit - 要返回的应用程序对象总数

  6. startedTimeBegin - 起始时间从此时间开始的应用程序,指定为自纪元以来的毫秒数

  7. startedTimeEnd - 起始时间在此时间结束的应用程序,指定为自纪元以来的毫秒数

  8. finishedTimeBegin - 完成时间以该时间开始的应用程序,以自纪元以来的毫秒数指定

  9. finishedTimeEnd - 完成时间以该时间结束的应用程序,以自纪元以来的毫秒数指定

  10. applicationTypes - 与给定应用程序类型匹配的应用程序,指定为逗号分隔的列表

apps(应用程序列表)对象的元素

当您请求应用程序列表时,信息将作为应用程序对象的集合返回。另请参阅 Application,了解应用程序对象的语法。

项目 数据类型 说明
app app 对象数组 (JSON)/零个或多个应用程序对象 (XML) 应用程序对象的集合

响应示例

JSON 响应

HTTP 请求

GET http://<timeline server http address:port>/ws/v1/applicationhistory/apps

响应标头

HTTP/1.1 200 OK
Content-Type: application/json
Transfer-Encoding: chunked

响应正文

{
  "app":
  [
      {
      "appId":"application_1430424020775_0004",
      "currentAppAttemptId":"appattempt_1430424020775_0004_000001",
      "user":"zshen",
      "name":"DistributedShell",
      "queue":"default",
      "type":"YARN",
      "host":"d-69-91-129-173.dhcp4.washington.edu/69.91.129.173",
      "rpcPort":-1,
      "appState":"FINISHED",
      "progress":100.0,
      "diagnosticsInfo":"",
      "originalTrackingUrl":"N/A",
      "trackingUrl":"http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0004/",
      "finalAppStatus":"SUCCEEDED",
      "submittedTime":1430425001004,
      "startedTime":1430425001004,
      "finishedTime":1430425008861,
      "elapsedTime":7857,
      "unmanagedApplication":"false",
      "applicationPriority":0,
      "appNodeLabelExpression":"",
      "amNodeLabelExpression":""
      },
      {
      "appId":"application_1430424020775_0003",
      "currentAppAttemptId":"appattempt_1430424020775_0003_000001",
      "user":"zshen",
      "name":"DistributedShell",
      "queue":"default",
      "type":"YARN",
      "host":"d-69-91-129-173.dhcp4.washington.edu/69.91.129.173",
      "rpcPort":-1,
      "appState":"FINISHED",
      "progress":100.0,
      "diagnosticsInfo":"",
      "originalTrackingUrl":"N/A",
      "trackingUrl":"http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0003/",
      "finalAppStatus":"SUCCEEDED",
      "submittedTime":1430424956650,
      "startedTime":1430424956650,
      "finishedTime":1430424963907,
      "elapsedTime":7257,
      "unmanagedApplication":"false",
      "applicationPriority":0,
      "appNodeLabelExpression":"",
      "amNodeLabelExpression":""
      },
      {
      "appId":"application_1430424020775_0002",
      "currentAppAttemptId":"appattempt_1430424020775_0002_000001",
      "user":"zshen",
      "name":"DistributedShell",
      "queue":"default",
      "type":"YARN",
      "host":"d-69-91-129-173.dhcp4.washington.edu/69.91.129.173",
      "rpcPort":-1,
      "appState":"FINISHED",
      "progress":100.0,
      "diagnosticsInfo":"",
      "originalTrackingUrl":"N/A",
      "trackingUrl":"http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0002/",
      "finalAppStatus":"SUCCEEDED",
      "submittedTime":1430424769395,
      "startedTime":1430424769395,
      "finishedTime":1430424776594,
      "elapsedTime":7199,
      "unmanagedApplication":"false",
      "applicationPriority":0,
      "appNodeLabelExpression":"",
      "amNodeLabelExpression":""
      },
      {
      "appId":"application_1430424020775_0001",
      "currentAppAttemptId":"appattempt_1430424020775_0001_000001",
      "user":"zshen",
      "name":"QuasiMonteCarlo",
      "queue":"default",
      "type":"MAPREDUCE",
      "host":"localhost",
      "rpcPort":56264,
      "appState":"FINISHED",
      "progress":100.0,
      "diagnosticsInfo":"",
      "originalTrackingUrl":"http://d-69-91-129-173.dhcp4.washington.edu:19888/jobhistory/job/job_1430424020775_0001",
      "trackingUrl":"http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0001/",
      "finalAppStatus":"SUCCEEDED",
      "submittedTime":1430424053809,
      "startedTime":1430424072153,
      "finishedTime":1430424776594,
      "elapsedTime":18344,
      "applicationTags":"mrapplication,ta-example",
      "unmanagedApplication":"false",
      "applicationPriority":0,
      "appNodeLabelExpression":"",
      "amNodeLabelExpression":""
      }
  ]
}

XML 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/applicationhistory/apps

响应标头

HTTP/1.1 200 OK
Content-Type: application/xml
Content-Length: 1710

响应正文

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<apps>
  <app>
    <appId>application_1430424020775_0004</appId>
    <currentAppAttemptId>appattempt_1430424020775_0004_000001</currentAppAttemptId>
    <user>zshen</user>
    <name>DistributedShell</name>
    <queue>default</queue>
    <type>YARN</type>
    <host>d-69-91-129-173.dhcp4.washington.edu/69.91.129.173</host>
    <rpcPort>-1</rpcPort>
    <appState>FINISHED</appState>
    <progress>100.0</progress>
    <diagnosticsInfo></diagnosticsInfo>
    <originalTrackingUrl>N/A</originalTrackingUrl>
    <trackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0004/</trackingUrl>
    <finalAppStatus>SUCCEEDED</finalAppStatus>
    <submittedTime>1430425001004</submittedTime>
    <startedTime>1430425001004</startedTime>
    <finishedTime>1430425008861</finishedTime>
    <elapsedTime>7857</elapsedTime>
    <unmanagedApplication>false</unmanagedApplication>
    <applicationPriority>0</applicationPriority>
    <appNodeLabelExpression></appNodeLabelExpression>
    <amNodeLabelExpression></amNodeLabelExpression>
  </app>
  <app>
    <appId>application_1430424020775_0003</appId>
    <currentAppAttemptId>appattempt_1430424020775_0003_000001</currentAppAttemptId>
    <user>zshen</user>
    <name>DistributedShell</name>
    <queue>default</queue>
    <type>YARN</type>
    <host>d-69-91-129-173.dhcp4.washington.edu/69.91.129.173</host>
    <rpcPort>-1</rpcPort>
    <appState>FINISHED</appState>
    <progress>100.0</progress>
    <diagnosticsInfo></diagnosticsInfo>
    <originalTrackingUrl>N/A</originalTrackingUrl>
    <trackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0003/</trackingUrl>
    <finalAppStatus>SUCCEEDED</finalAppStatus>
    <submittedTime>1430424956650</submittedTime>
    <startedTime>1430424956650</startedTime>
    <finishedTime>1430424963907</finishedTime>
    <elapsedTime>7257</elapsedTime>
    <unmanagedApplication>false</unmanagedApplication>
    <applicationPriority>0</applicationPriority>
    <appNodeLabelExpression></appNodeLabelExpression>
    <amNodeLabelExpression></amNodeLabelExpression>
  </app>
  <app>
    <appId>application_1430424020775_0002</appId>
    <currentAppAttemptId>appattempt_1430424020775_0002_000001</currentAppAttemptId>
    <user>zshen</user>
    <name>DistributedShell</name>
    <queue>default</queue>
    <type>YARN</type>
    <host>d-69-91-129-173.dhcp4.washington.edu/69.91.129.173</host>
    <rpcPort>-1</rpcPort>
    <appState>FINISHED</appState>
    <progress>100.0</progress>
    <diagnosticsInfo></diagnosticsInfo>
    <originalTrackingUrl>N/A</originalTrackingUrl>
    <trackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0002/</trackingUrl>
    <finalAppStatus>SUCCEEDED</finalAppStatus>
    <submittedTime>1430424769395</submittedTime>
    <startedTime>1430424769395</startedTime>
    <finishedTime>1430424776594</finishedTime>
    <elapsedTime>7199</elapsedTime>
    <unmanagedApplication>false</unmanagedApplication>
    <applicationPriority>0</applicationPriority>
    <appNodeLabelExpression></appNodeLabelExpression>
    <amNodeLabelExpression></amNodeLabelExpression>
  </app>
  <app>
    <appId>application_1430424020775_0001</appId>
    <currentAppAttemptId>appattempt_1430424020775_0001_000001</currentAppAttemptId>
    <user>zshen</user>
    <name>QuasiMonteCarlo</name>
    <queue>default</queue>
    <type>MAPREDUCE</type>
    <host>localhost</host>
    <rpcPort>56264</rpcPort>
    <appState>FINISHED</appState>
    <progress>100.0</progress>
    <diagnosticsInfo></diagnosticsInfo>
    <originalTrackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:19888/jobhistory/job/job_1430424020775_0001</originalTrackingUrl>
    <trackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0001/</trackingUrl>
    <finalAppStatus>SUCCEEDED</finalAppStatus>
    <submittedTime>1430424053809</submittedTime>
    <startedTime>1430424053809</startedTime>
    <finishedTime>1430424072153</finishedTime>
    <elapsedTime>18344</elapsedTime>
    <applicationTags>mrapplication,ta-example</applicationTags>
    <unmanagedApplication>false</unmanagedApplication>
    <applicationPriority>0</applicationPriority>
    <appNodeLabelExpression></appNodeLabelExpression>
    <amNodeLabelExpression></amNodeLabelExpression>
  </app>
</apps>

应用程序

使用应用程序 API,您可以获取应用程序资源,其中包含有关在 YARN 集群上运行的特定应用程序的信息。

它本质上是 YARN ApplicationReport 结构的 XML/JSON 序列化形式。

URI

使用以下 URI 获取由 appid 值标识的应用程序对象。

http(s)://<timeline server http(s) address:port>/ws/v1/applicationhistory/apps/{appid}

支持的 HTTP 操作

GET

支持的查询参数

app(应用程序)对象的元素

项目 数据类型 说明
appId 字符串 应用程序 ID
user 字符串 启动应用程序的用户
name 字符串 应用程序名称
type 字符串 应用程序类型
queue 字符串 应用程序提交到的队列
appState 字符串 根据 ResourceManager 的应用程序状态 - 有效值是 YarnApplicationState 枚举的成员:FINISHEDFAILEDKILLED
finalStatus 字符串 已完成的应用程序的最终状态(如果已完成) - 由应用程序本身报告 - 有效值:UNDEFINEDSUCCEEDEDFAILEDKILLED
progress float 应用程序报告的进度(以百分比表示)。长期运行的 YARN 服务可能不会在此处提供有意义的值,或将其用作实际容器计数与所需容器计数的度量标准
trackingUrl 字符串 应用程序的 Web URL(通过 RM 代理)
originalTrackingUrl 字符串 应用程序的实际 Web URL
diagnosticsInfo 字符串 已完成应用程序的详细诊断信息
startedTime 长整数 应用程序启动的时间(以自纪元以来的毫秒数表示)
finishedTime 长整数 应用程序完成的时间(以自纪元以来的毫秒数表示)
elapsedTime 长整数 自应用程序启动以来的经过时间(以毫秒为单位)
allocatedMB int 分配给应用程序正在运行的容器的内存总量(以 MB 为单位)
allocatedVCores int 分配给应用程序正在运行的容器的虚拟内核总量
currentAppAttemptId 字符串 最新的应用程序尝试 ID
host 字符串 ApplicationMaster 的主机
rpcPort int ApplicationMaster 的 RPC 端口;如果未声明 IPC 服务,则为零
applicationTags 字符串 应用程序标记。
unmanagedApplication boolean 应用程序是否不受管理。
applicationPriority int 提交的应用程序的优先级。
appNodeLabelExpression 字符串 节点标签表达式,用于识别应用程序容器默认运行的节点。
amNodeLabelExpression 字符串 节点标签表达式,用于识别应用程序 AM 容器运行的节点。

响应示例

JSON 响应

HTTP 请求

https://127.0.0.1:8188/ws/v1/applicationhistory/apps/application_1430424020775_0001

响应标头

HTTP/1.1 200 OK
Content-Type: application/json
Transfer-Encoding: chunked

响应正文

{
  "appId": "application_1430424020775_0001",
  "currentAppAttemptId": "appattempt_1430424020775_0001_000001",
  "user": "zshen",
  "name": "QuasiMonteCarlo",
  "queue": "default",
  "type": "MAPREDUCE",
  "host": "localhost",
  "rpcPort": 56264,
  "appState": "FINISHED",
  "progress": 100.0,
  "diagnosticsInfo": "",
  "originalTrackingUrl": "http://d-69-91-129-173.dhcp4.washington.edu:19888/jobhistory/job/job_1430424020775_0001",
  "trackingUrl": "http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0001/",
  "finalAppStatus": "SUCCEEDED",
  "submittedTime": 1430424053809,
  "startedTime": 1430424053809,
  "finishedTime": 1430424072153,
  "elapsedTime": 18344,
  "applicationTags": mrapplication,tag-example,
  "unmanagedApplication": "false",
  "applicationPriority": 0,
  "appNodeLabelExpression": "",
  "amNodeLabelExpression": ""
}

XML 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/applicationhistory/apps/application_1430424020775_0001
Accept: application/xml

响应标头

HTTP/1.1 200 OK
Content-Type: application/xml
Content-Length: 873

响应正文

 <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
 <app>
   <appId>application_1430424020775_0001</appId>
   <currentAppAttemptId>appattempt_1430424020775_0001_000001</currentAppAttemptId>
   <user>zshen</user>
   <name>QuasiMonteCarlo</name>
   <queue>default</queue>
   <type>MAPREDUCE</type>
   <host>localhost</host>
   <rpcPort>56264</rpcPort>
   <appState>FINISHED</appState>
   <progress>100.0</progress>
   <diagnosticsInfo></diagnosticsInfo>
   <originalTrackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:19888/jobhistory/job/job_1430424020775_0001</originalTrackingUrl>
   <trackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0001/</trackingUrl>
   <finalAppStatus>SUCCEEDED</finalAppStatus>
   <submittedTime>1430424053809</submittedTime>
   <startedTime>1430424053809</startedTime>
   <finishedTime>1430424072153</finishedTime>
   <elapsedTime>18344</elapsedTime>
   <applicationTags>mrapplication,ta-example</applicationTags>
   <unmanagedApplication>false</unmanagedApplication>
   <applicationPriority>0</applicationPriority>
   <appNodeLabelExpression><appNodeLabelExpression>
   <amNodeLabelExpression><amNodeLabelExpression>
 </app>

应用程序尝试列表

使用应用程序尝试列表 API,您可以获取资源集合,其中每个资源都代表一个应用程序尝试。当您对此资源运行 GET 操作时,您将获得应用程序尝试对象的集合。

URI

使用以下 URI 获取由 appid 值标识的应用程序的所有尝试对象。

http(s)://<timeline server http(s) address:port>/ws/v1/applicationhistory/apps/{appid}/appattempts

支持的 HTTP 操作

GET

支持的查询参数

appattempts(应用程序尝试列表)对象的元素

当您请求应用程序尝试列表时,信息将作为应用程序尝试对象的集合返回。有关应用程序尝试对象的语法,请参阅 应用程序尝试

项目 数据类型 说明
appattempt appattempt 对象数组 (JSON)/零个或多个应用程序尝试对象 (XML) 应用程序尝试对象的集合

响应示例

JSON 响应

HTTP 请求

GET  https://127.0.0.1:8188/ws/v1/applicationhistory/apps/application_1430424020775_0001/appattempts

响应标头

HTTP/1.1 200 OK
Content-Type: application/json
Transfer-Encoding: chunked

响应正文

{
  "appAttempt": [
    {
      "appAttemptId": "appattempt_1430424020775_0001_000001",
      "host": "localhost",
      "rpcPort": 56264,
      "trackingUrl": "http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0001/",
      "originalTrackingUrl": "http://d-69-91-129-173.dhcp4.washington.edu:19888/jobhistory/job/job_1430424020775_0001",
      "diagnosticsInfo": "",
      "appAttemptState": "FINISHED",
      "amContainerId": "container_1430424020775_0001_01_000001"
    }
  ]
}

XML 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/applicationhistory/apps/application_1430424020775_0001/appattempts
Accept: application/xml

响应标头

HTTP/1.1 200 OK
Content-Type: application/xml

响应正文

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<appAttempts>
  <appAttempt>
    <appAttemptId>appattempt_1430424020775_0001_000001</appAttemptId>
    <host>localhost</host>
    <rpcPort>56264</rpcPort>
    <trackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0001/</trackingUrl>
    <originalTrackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:19888/jobhistory/job/job_1430424020775_0001</originalTrackingUrl>
    <diagnosticsInfo></diagnosticsInfo>
    <appAttemptState>FINISHED</appAttemptState>
    <amContainerId>container_1430424020775_0001_01_000001</amContainerId>
  </appAttempt>
</appAttempts>

应用程序尝试

使用应用程序尝试 API,您可以获取应用程序尝试资源,其中包含有关在 YARN 集群上运行的应用程序的特定应用程序尝试的信息。

URI

使用以下 URI 获取由 appid 值和 appattemptid 值标识的应用程序尝试对象。

http(s)://<timeline server http(s) address:port>/ws/v1/applicationhistory/apps/{appid}/appattempts/{appattemptid}

支持的 HTTP 操作

GET

支持的查询参数

appattempt(应用程序尝试)对象的元素

项目 数据类型 说明
appAttemptId 字符串 应用程序尝试 ID
amContainerId 字符串 ApplicationMaster 容器 ID
appAttemptState 字符串 根据 ResourceManager 的应用程序尝试状态 - 有效值是 YarnApplicationAttemptState 枚举的成员:FINISHED、FAILED、KILLED
trackingUrl 字符串 可用于跟踪应用程序的 Web URL
originalTrackingUrl 字符串 应用程序的实际 Web URL
diagnosticsInfo 字符串 详细的诊断信息
host 字符串 ApplicationMaster 的主机
rpcPort int ApplicationMaster 的 RPC 端口

响应示例

JSON 响应

HTTP 请求

https://127.0.0.1:8188/ws/v1/applicationhistory/apps/application_1430424020775_0001/appattempts/appattempt_1430424020775_0001_000001

响应标头

HTTP/1.1 200 OK
Content-Type: application/json
Transfer-Encoding: chunked

响应正文

{
  "appAttemptId": "appattempt_1430424020775_0001_000001",
  "host": "localhost",
  "rpcPort": 56264,
  "trackingUrl": "http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0001/",
  "originalTrackingUrl": "http://d-69-91-129-173.dhcp4.washington.edu:19888/jobhistory/job/job_1430424020775_0001",
  "diagnosticsInfo": "",
  "appAttemptState": "FINISHED",
  "amContainerId": "container_1430424020775_0001_01_000001"
}

XML 响应

HTTP 请求

GET http://<timeline server http address:port>/ws/v1/applicationhistory/apps/application_1395789200506_0001/appattempts/appattempt_1395789200506_0001_000001
Accept: application/xml

响应标头

HTTP/1.1 200 OK
Content-Type: application/xml
Content-Length: 488

响应正文

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<appAttempt>
  <appAttemptId>appattempt_1430424020775_0001_000001</appAttemptId>
  <host>localhost</host>
  <rpcPort>56264</rpcPort>
  <trackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:8088/proxy/application_1430424020775_0001/</trackingUrl>
  <originalTrackingUrl>http://d-69-91-129-173.dhcp4.washington.edu:19888/jobhistory/job/job_1430424020775_0001</originalTrackingUrl>
  <diagnosticsInfo></diagnosticsInfo>
  <appAttemptState>FINISHED</appAttemptState>
  <amContainerId>container_1430424020775_0001_01_000001</amContainerId>
</appAttempt>

容器列表

使用容器列表 API,您可以获取资源集合,其中每个资源都代表一个容器。当您对此资源运行 GET 操作时,您将获得容器对象的集合。

URI

使用以下 URI 获取由 appid 值和 appattemptid 值标识的应用程序尝试的所有容器对象。

http(s)://<timeline server http(s) address:port>/ws/v1/applicationhistory/apps/{appid}/appattempts/{appattemptid}/containers

支持的 HTTP 操作

GET

支持的查询参数

containers(容器列表)对象的元素

当您请求容器列表时,信息将作为容器对象集合返回。另请参见 Container 了解容器对象的语法。

项目 数据类型 说明
container 容器对象数组(JSON)/零个或多个容器对象(XML) 容器对象集合

响应示例

JSON 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/applicationhistory/apps/application_1430424020775_0001/appattempts/appattempt_1430424020775_0001_000001/containers?

响应标头

HTTP/1.1 200 OK
Content-Type: application/json
Transfer-Encoding: chunked

响应正文

{
  "container": [
    {
      "containerId": "container_1430424020775_0001_01_000007",
      "allocatedMB": 1024,
      "allocatedVCores": 1,
      "assignedNodeId": "localhost:9105",
      "priority": 10,
      "startedTime": 1430424068296,
      "finishedTime": 1430424073006,
      "elapsedTime": 4710,
      "diagnosticsInfo": "Container killed by the ApplicationMaster.\nContainer killed on request. Exit code is 143\nContainer exited with a non-zero exit code 143\n",
      "logUrl": "http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000007/container_1430424020775_0001_01_000007/zshen",
      "containerExitStatus": -105,
      "containerState": "COMPLETE",
      "nodeHttpAddress": "https://127.0.0.1:8042"
    },
    {
      "containerId": "container_1430424020775_0001_01_000006",
      "allocatedMB": 1024,
      "allocatedVCores": 1,
      "assignedNodeId": "localhost:9105",
      "priority": 20,
      "startedTime": 1430424060317,
      "finishedTime": 1430424068293,
      "elapsedTime": 7976,
      "diagnosticsInfo": "Container killed by the ApplicationMaster.\nContainer killed on request. Exit code is 143\nContainer exited with a non-zero exit code 143\n",
      "logUrl": "http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000006/container_1430424020775_0001_01_000006/zshen",
      "containerExitStatus": -105,
      "containerState": "COMPLETE",
      "nodeHttpAddress": "https://127.0.0.1:8042"
    },
    {
      "containerId": "container_1430424020775_0001_01_000005",
      "allocatedMB": 1024,
      "allocatedVCores": 1,
      "assignedNodeId": "localhost:9105",
      "priority": 20,
      "startedTime": 1430424060316,
      "finishedTime": 1430424068294,
      "elapsedTime": 7978,
      "diagnosticsInfo": "Container killed by the ApplicationMaster.\nContainer killed on request. Exit code is 143\nContainer exited with a non-zero exit code 143\n",
      "logUrl": "http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000005/container_1430424020775_0001_01_000005/zshen",
      "containerExitStatus": -105,
      "containerState": "COMPLETE",
      "nodeHttpAddress": "https://127.0.0.1:8042"
    },
    {
      "containerId": "container_1430424020775_0001_01_000003",
      "allocatedMB": 1024,
      "allocatedVCores": 1,
      "assignedNodeId": "localhost:9105",
      "priority": 20,
      "startedTime": 1430424060315,
      "finishedTime": 1430424068289,
      "elapsedTime": 7974,
      "diagnosticsInfo": "Container killed by the ApplicationMaster.\nContainer killed on request. Exit code is 143\nContainer exited with a non-zero exit code 143\n",
      "logUrl": "http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000003/container_1430424020775_0001_01_000003/zshen",
      "containerExitStatus": -105,
      "containerState": "COMPLETE",
      "nodeHttpAddress": "https://127.0.0.1:8042"
    },
    {
      "containerId": "container_1430424020775_0001_01_000004",
      "allocatedMB": 1024,
      "allocatedVCores": 1,
      "assignedNodeId": "localhost:9105",
      "priority": 20,
      "startedTime": 1430424060315,
      "finishedTime": 1430424068291,
      "elapsedTime": 7976,
      "diagnosticsInfo": "Container killed by the ApplicationMaster.\nContainer killed on request. Exit code is 143\nContainer exited with a non-zero exit code 143\n",
      "logUrl": "http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000004/container_1430424020775_0001_01_000004/zshen",
      "containerExitStatus": -105,
      "containerState": "COMPLETE",
      "nodeHttpAddress": "https://127.0.0.1:8042"
    },
    {
      "containerId": "container_1430424020775_0001_01_000002",
      "allocatedMB": 1024,
      "allocatedVCores": 1,
      "assignedNodeId": "localhost:9105",
      "priority": 20,
      "startedTime": 1430424060313,
      "finishedTime": 1430424067250,
      "elapsedTime": 6937,
      "diagnosticsInfo": "Container killed by the ApplicationMaster.\nContainer killed on request. Exit code is 143\nContainer exited with a non-zero exit code 143\n",
      "logUrl": "http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000002/container_1430424020775_0001_01_000002/zshen",
      "containerExitStatus": -105,
      "containerState": "COMPLETE",
      "nodeHttpAddress": "https://127.0.0.1:8042"
    },
    {
      "containerId": "container_1430424020775_0001_01_000001",
      "allocatedMB": 2048,
      "allocatedVCores": 1,
      "assignedNodeId": "localhost:9105",
      "priority": 0,
      "startedTime": 1430424054314,
      "finishedTime": 1430424079022,
      "elapsedTime": 24708,
      "diagnosticsInfo": "",
      "logUrl": "http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000001/container_1430424020775_0001_01_000001/zshen",
      "containerExitStatus": 0,
      "containerState": "COMPLETE",
      "nodeHttpAddress": "https://127.0.0.1:8042"
    }
  ]
}

XML 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/applicationhistory/apps/application_1430424020775_0001/appattempts/appattempt_1430424020775_0001_000001/containers
Accept: application/xml

响应标头

  HTTP/1.1 200 OK
  Content-Type: application/xml
  Content-Length: 1428

响应正文

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<containers>
  <container>
    <containerId>container_1430424020775_0001_01_000007</containerId>
    <allocatedMB>1024</allocatedMB>
    <allocatedVCores>1</allocatedVCores>
    <assignedNodeId>localhost:9105</assignedNodeId>
    <priority>10</priority>
    <startedTime>1430424068296</startedTime>
    <finishedTime>1430424073006</finishedTime>
    <elapsedTime>4710</elapsedTime>
    <diagnosticsInfo>Container killed by the ApplicationMaster.
      Container killed on request. Exit code is 143
      Container exited with a non-zero exit code 143
    </diagnosticsInfo>
    <logUrl>http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000007/container_1430424020775_0001_01_000007/zshen</logUrl>
    <containerExitStatus>-105</containerExitStatus>
    <containerState>COMPLETE</containerState>
    <nodeHttpAddress>https://127.0.0.1:8042</nodeHttpAddress>
  </container>
  <container>
    <containerId>container_1430424020775_0001_01_000006</containerId>
    <allocatedMB>1024</allocatedMB>
    <allocatedVCores>1</allocatedVCores>
    <assignedNodeId>localhost:9105</assignedNodeId>
    <priority>20</priority>
    <startedTime>1430424060317</startedTime>
    <finishedTime>1430424068293</finishedTime>
    <elapsedTime>7976</elapsedTime>
    <diagnosticsInfo>Container killed by the ApplicationMaster.
      Container killed on request. Exit code is 143
      Container exited with a non-zero exit code 143
    </diagnosticsInfo>
    <logUrl>http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000006/container_1430424020775_0001_01_000006/zshen</logUrl>
    <containerExitStatus>-105</containerExitStatus>
    <containerState>COMPLETE</containerState>
    <nodeHttpAddress>https://127.0.0.1:8042</nodeHttpAddress>
  </container>
  <container>
    <containerId>container_1430424020775_0001_01_000005</containerId>
    <allocatedMB>1024</allocatedMB>
    <allocatedVCores>1</allocatedVCores>
    <assignedNodeId>localhost:9105</assignedNodeId>
    <priority>20</priority>
    <startedTime>1430424060316</startedTime>
    <finishedTime>1430424068294</finishedTime>
    <elapsedTime>7978</elapsedTime>
    <diagnosticsInfo>Container killed by the ApplicationMaster.
      Container killed on request. Exit code is 143
      Container exited with a non-zero exit code 143
    </diagnosticsInfo>
    <logUrl>http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000005/container_1430424020775_0001_01_000005/zshen</logUrl>
    <containerExitStatus>-105</containerExitStatus>
    <containerState>COMPLETE</containerState>
    <nodeHttpAddress>https://127.0.0.1:8042</nodeHttpAddress>
  </container>
  <container>
    <containerId>container_1430424020775_0001_01_000003</containerId>
    <allocatedMB>1024</allocatedMB>
    <allocatedVCores>1</allocatedVCores>
    <assignedNodeId>localhost:9105</assignedNodeId>
    <priority>20</priority>
    <startedTime>1430424060315</startedTime>
    <finishedTime>1430424068289</finishedTime>
    <elapsedTime>7974</elapsedTime>
    <diagnosticsInfo>Container killed by the ApplicationMaster.
      Container killed on request. Exit code is 143
      Container exited with a non-zero exit code 143
    </diagnosticsInfo>
    <logUrl>http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000003/container_1430424020775_0001_01_000003/zshen</logUrl>
    <containerExitStatus>-105</containerExitStatus>
    <containerState>COMPLETE</containerState>
    <nodeHttpAddress>https://127.0.0.1:8042</nodeHttpAddress>
  </container>
  <container>
    <containerId>container_1430424020775_0001_01_000004</containerId>
    <allocatedMB>1024</allocatedMB>
    <allocatedVCores>1</allocatedVCores>
    <assignedNodeId>localhost:9105</assignedNodeId>
    <priority>20</priority>
    <startedTime>1430424060315</startedTime>
    <finishedTime>1430424068291</finishedTime>
    <elapsedTime>7976</elapsedTime>
    <diagnosticsInfo>Container killed by the ApplicationMaster.
      Container killed on request. Exit code is 143
      Container exited with a non-zero exit code 143
    </diagnosticsInfo>
    <logUrl>http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000004/container_1430424020775_0001_01_000004/zshen</logUrl>
    <containerExitStatus>-105</containerExitStatus>
    <containerState>COMPLETE</containerState>
    <nodeHttpAddress>https://127.0.0.1:8042</nodeHttpAddress>
  </container>
  <container>
    <containerId>container_1430424020775_0001_01_000002</containerId>
    <allocatedMB>1024</allocatedMB>
    <allocatedVCores>1</allocatedVCores>
    <assignedNodeId>localhost:9105</assignedNodeId>
    <priority>20</priority>
    <startedTime>1430424060313</startedTime>
    <finishedTime>1430424067250</finishedTime>
    <elapsedTime>6937</elapsedTime>
    <diagnosticsInfo>Container killed by the ApplicationMaster.
      Container killed on request. Exit code is 143
      Container exited with a non-zero exit code 143
    </diagnosticsInfo>
    <logUrl>http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000002/container_1430424020775_0001_01_000002/zshen</logUrl>
    <containerExitStatus>-105</containerExitStatus>
    <containerState>COMPLETE</containerState>
    <nodeHttpAddress>https://127.0.0.1:8042</nodeHttpAddress>
  </container>
  <container>
    <containerId>container_1430424020775_0001_01_000001</containerId>
    <allocatedMB>2048</allocatedMB>
    <allocatedVCores>1</allocatedVCores>
    <assignedNodeId>localhost:9105</assignedNodeId>
    <priority>0</priority>
    <startedTime>1430424054314</startedTime>
    <finishedTime>1430424079022</finishedTime>
    <elapsedTime>24708</elapsedTime>
    <diagnosticsInfo></diagnosticsInfo>
    <logUrl>http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000001/container_1430424020775_0001_01_000001/zshen</logUrl>
    <containerExitStatus>0</containerExitStatus>
    <containerState>COMPLETE</containerState>
    <nodeHttpAddress>https://127.0.0.1:8042</nodeHttpAddress>
  </container>
</containers>

容器

使用容器 API,您可以获取一个容器资源,其中包含有关在 YARN 集群上运行的应用程序的应用程序尝试的特定容器的信息。

URI

使用以下 URI 获取由 appid 值、appattemptid 值和 containerid 值标识的容器对象。

http(s)://<timeline server http(s) address:port>/ws/v1/applicationhistory/apps/{appid}/appattempts/{appattemptid}/containers/{containerid}

支持的 HTTP 操作

GET

支持的查询参数

container(容器)对象的元素

项目 数据类型 说明
containerId 字符串 容器 ID
containerState 字符串 根据 ResourceManager 的容器状态 - 有效值是 ContainerState 枚举的成员:COMPLETE
containerExitStatus int 容器退出状态
logUrl 字符串 可用于访问容器聚合日志的日志 URL
diagnosticsInfo 字符串 详细的诊断信息
startedTime 长整数 容器启动的时间(自纪元以来的毫秒数)
finishedTime 长整数 容器完成的时间(自纪元以来的毫秒数)
elapsedTime 长整数 自容器启动以来的经过时间(以毫秒为单位)
allocatedMB int 分配给容器的内存(以 MB 为单位)
allocatedVCores int 分配给容器的虚拟内核
priority int 容器的优先级
assignedNodeId 字符串 容器的已分配节点主机和端口

响应示例

JSON 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/applicationhistory/apps/application_1430424020775_0001/appattempts/appattempt_1430424020775_0001_000001/containers/container_1430424020775_0001_01_000001

响应标头

HTTP/1.1 200 OK
Content-Type: application/json
Transfer-Encoding: chunked

响应正文

{
  "containerId": "container_1430424020775_0001_01_000001",
  "allocatedMB": 2048,
  "allocatedVCores": 1,
  "assignedNodeId": "localhost:9105",
  "priority": 0,
  "startedTime": 1430424054314,
  "finishedTime": 1430424079022,
  "elapsedTime": 24708,
  "diagnosticsInfo": "",
  "logUrl": "http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000001/container_1430424020775_0001_01_000001/zshen",
  "containerExitStatus": 0,
  "containerState": "COMPLETE",
  "nodeHttpAddress": "https://127.0.0.1:8042"
}

XML 响应

HTTP 请求

GET https://127.0.0.1:8188/ws/v1/applicationhistory/apps/application_1430424020775_0001/appattempts/appattempt_1430424020775_0001_000001/containers/container_1430424020775_0001_01_000001
Accept: application/xml

响应标头

HTTP/1.1 200 OK
Content-Type: application/xml
Content-Length: 669

响应正文

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<container>
  <containerId>container_1430424020775_0001_01_000001</containerId>
  <allocatedMB>2048</allocatedMB>
  <allocatedVCores>1</allocatedVCores>
  <assignedNodeId>localhost:9105</assignedNodeId>
  <priority>0</priority>
  <startedTime>1430424054314</startedTime>
  <finishedTime>1430424079022</finishedTime>
  <elapsedTime>24708</elapsedTime>
  <diagnosticsInfo></diagnosticsInfo>
  <logUrl>http://0.0.0.0:8188/applicationhistory/logs/localhost:9105/container_1430424020775_0001_01_000001/container_1430424020775_0001_01_000001/zshen</logUrl>
  <containerExitStatus>0</containerExitStatus>
  <containerState>COMPLETE</containerState>
  <nodeHttpAddress>https://127.0.0.1:8042</nodeHttpAddress>
</container>

响应代码

  1. 无法解析域、实体类型、实体 ID 或类似内容的查询会导致 HTTP 404,“未找到”响应。
  2. 路径、参数或值无效的请求会导致错误请求,400,响应。
  3. 在安全集群中,当尝试执行调用者没有足够权限的操作时,将生成 401,“禁止”响应。查询某些实体(如域)时会例外;在这种情况下,API 会故意将权限被拒绝的结果降级为“空”和“未找到”响应。这会向未经授权的调用者隐藏其他域的详细信息。
  4. 如果时间线实体 PUT 操作的内容无效,此故障不会导致返回 HTTP 错误代码。将返回 200 状态代码,但是,对于无法添加的每个实体,在失败实体列表中都会有错误代码。

时间线服务器性能测试工具

亮点

时间线服务器性能测试工具有助于衡量时间线服务器的写入性能。该测试启动 SimpleEntityWriter 映射器或 JobHistoryFileReplay 映射器,以将时间线实体写入时间线服务器。最后,将衡量和打印出每个映射器的交易率 (ops/s) 和总交易率。使用 SimpleEntityWriter 映射器运行测试还将衡量和显示每个映射器的 IO 率 (KB/s) 和总 IO 率。

用法

映射器类型说明

  1. SimpleEntityWriter 映射器 每个映射器将指定数量的用户指定大小的时间线实体写入时间线服务器。SimpleEntityWrite 是性能测试工具的默认映射器。
    1. JobHistoryFileReplay 映射器 每个映射器都会重放指定目录下的作业历史记录文件(需要 jhist 文件及其对应的 conf.xml 才能重放。映射器的数量不得多于作业历史记录文件数量)。每个映射器都会被分配一些作业历史记录文件进行重放。对于每个作业历史记录文件,映射器将对其进行解析以获取作业信息,然后创建时间线实体。每个映射器还可以选择一次性写入所有创建的时间线实体或一次写入一个。

选项

[-m <maps>] number of mappers (default: 1)
[-v] timeline service version
[-mtype <mapper type in integer>]
      1. simple entity write mapper (default)
      2. jobhistory files replay mapper
[-s <(KBs)test>] number of KB per put (mtype=1, default: 1 KB)
[-t] package sending iterations per mapper (mtype=1, default: 100)
[-d <path>] root path of job history files (mtype=2)
[-r <replay mode>] (mtype=2)
      1. write all entities for a job in one put (default)
      2. write one entity at a time

示例运行

运行 SimpleEntityWriter 测试

bin/hadoop jar performanceTest.jar timelineperformance -m 4 -mtype 1 -s 3 -t 200

SimpleEntityWriter 测试的示例输出

TRANSACTION RATE (per mapper): 20000.0 ops/s
IO RATE (per mapper): 60000.0 KB/s
TRANSACTION RATE (total): 80000.0 ops/s
IO RATE (total): 240000.0 KB/s

运行 JobHistoryFileReplay 映射器测试

$ bin/hadoop jar performanceTest.jar timelineperformance -m 2 -mtype 2 -d /testInput -r 2

JobHistoryFileReplay 映射器测试的示例输入

$ bin/hadoop fs -ls /testInput
/testInput/job_1.jhist
/testInput/job_1_conf.xml
/testInput/job_2.jhist
/testInput/job_2_conf.xml

JobHistoryFileReplay 测试的示例输出

TRANSACTION RATE (per mapper): 4000.0 ops/s
IO RATE (per mapper): 0.0 KB/s
TRANSACTION RATE (total): 8000.0 ops/s
IO RATE (total): 0.0 KB/s