未验证 提交 738b613f 编写于 作者: I ImPerat0R_ 提交者: GitHub

Merge pull request #28 from tssujt/scheduler

Proofread schedule section
......@@ -14,8 +14,7 @@ Airflow调度程序旨在作为Airflow生产环境中的持久服务运行。
要启动调度程序,只需运行以下命令:
```
airflow scheduler
airflow scheduler
```
## DAG运行
......@@ -46,28 +45,28 @@ DAG运行具有与它们相关联的状态(运行,失败,成功),并
如果你的DAG被编写来处理它自己的追赶(IE不仅限于间隔,而是改为“现在”。),那么你将需要关闭追赶(在DAG本身上使用`dag.catchup = False` )或者默认情况下在配置文件级别使用`catchup_by_default = False` 。 这样做,是指示调度程序仅为DAG间隔序列的最新实例创建DAG运行。
```
"""
"""
Code that goes along with the Airflow tutorial located at:
https://github.com/airbnb/airflow/blob/master/airflow/example_dags/tutorial.py
"""
from airflow import DAG
from airflow.operators.bash_operator import BashOperator
from datetime import datetime , timedelta
from datetime import datetime, timedelta
default_args = {
'owner' : 'airflow' ,
'depends_on_past' : False ,
'start_date' : datetime ( 2015 , 12 , 1 ),
'email' : [ 'airflow@example.com' ],
'email_on_failure' : False ,
'email_on_retry' : False ,
'retries' : 1 ,
'retry_delay' : timedelta ( minutes = 5 ),
'schedule_interval' : '@hourly' ,
'owner': 'airflow',
'depends_on_past': False,
'start_date': datetime(2015, 12, 1),
'email': ['airflow@example.com'],
'email_on_failure': False,
'email_on_retry': False,
'retries': 1,
'retry_delay': timedelta(minutes=5),
'schedule_interval': '@hourly',
}
dag = DAG ( 'tutorial' , catchup = False , default_args = default_args )
dag = DAG('tutorial', catchup=False, default_args=default_args)
```
在上面的示例中,如果调度程序守护程序在2016-01-02上午6点(或从命令行)拾取DAG,则将创建单个DAG运行,其`execution_date`为2016-01-01 ,下一个将在2016-01-03上午午夜后创建,执行日期为2016-01-02。
......@@ -82,15 +81,15 @@ dag = DAG ( 'tutorial' , catchup = False , default_args = default_args )
## 要牢记
* 第一个`DAG Run`是基于DAG中任务的最小`start_date`创建的。
* 后续`DAG Runs`由调度程序进程根据您的DAG的`schedule_interval`顺序创建。
* 当清除一组任务的状态以期让它们重新运行时,重要的是要记住`DAG Run`的状态,因为它定义了调度程序是否应该查看该运行的触发任务。
* 第一个`DAG Run`是基于DAG中任务的最小`start_date`创建的。
* 后续`DAG Runs`由调度程序进程根据您的DAG的`schedule_interval`顺序创建。
* 当清除一组任务的状态以期让它们重新运行时,重要的是要记住`DAG Run`的状态,因为它定义了调度程序是否应该查看该运行的触发任务。
以下是一些可以**取消阻止任务的方法**
* 在UI中,您可以从任务实例对话框中**清除** (如删除状态)各个任务实例,同时定义是否要包括过去/未来和上游/下游依赖项。 请注意,接下来会出现一个确认窗口,您可以看到要清除的设置。 您还可以清除与dag关联的所有任务实例。
* CLI命令`airflow clear -h`在清除任务实例状态时有很多选项,包括指定日期范围,通过指定正则表达式定位task_ids,包含上游和下游亲属的标志,以及特定状态下的目标任务实例( `failed``success`
* 清除任务实例将不再删除任务实例记录。 相反,它更新max_tries并将当前任务实例状态设置为None。
* 将任务实例标记为失败可以通过UI完成。 这可用于停止运行任务实例。
* 将任务实例标记为成功可以通过UI完成。 这主要是为了修复漏报,或者例如在Airflow之外应用修复时。
* `airflow backfill` CLI子命令具有`--mark_success`标志,允许选择DAG的子部分以及指定日期范围。
* 在UI中,您可以从任务实例对话框中**清除** (如删除状态)各个任务实例,同时定义是否要包括过去/未来和上游/下游依赖项。 请注意,接下来会出现一个确认窗口,您可以看到要清除的设置。 您还可以清除与dag关联的所有任务实例。
* CLI命令`airflow clear -h`在清除任务实例状态时有很多选项,包括指定日期范围,通过指定正则表达式定位task_ids,包含上游和下游亲属的标志,以及特定状态下的目标任务实例( `failed``success`
* 清除任务实例将不再删除任务实例记录。 相反,它更新max_tries并将当前任务实例状态设置为None。
* 将任务实例标记为失败可以通过UI完成。 这可用于停止运行任务实例。
* 将任务实例标记为成功可以通过UI完成。 这主要是为了修复漏报,或者例如在Airflow之外应用修复时。
* `airflow backfill` CLI子命令具有`--mark_success`标志,允许选择DAG的子部分以及指定日期范围。
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册