--- sidebar_position: 3 --- # Python Connector Python 连接器的使用参见[视频教程](https://www.taosdata.com/blog/2020/11/11/1963.html) - **安装**:参见下面具体步骤 - **示例程序**:位于 install_directory/examples/python ### 安装 Python 连接器支持的系统有:Linux 64/Windows x64 安装前准备: - 已安装好 TDengine 应用驱动,请参考[安装连接器驱动步骤](https://www.taosdata.com/cn/documentation/connector#driver) - 已安装 python 2.7 or >= 3.4 - 已安装 pip ### Python 连接器安装 Python 连接器可以通过 `pip` 从 PyPI 下载安装。注意 TDengine Python 连接器的包名为 `taospy` 而不是 `taos`(这是一个与 TDengine 无关的另一个程序)。但为保持向后兼容性,仍然使用 `import taos` 导入。 ```bash pip install taospy ``` 如果不使用系统默认的 `python` 和 `pip`,则需要指定 `pip` 的版本或路径: ```bash pip2 install taospy pip3 install taospy ``` Python 命令行依赖 taos 动态库 `libtaos.so` 或 `taos.dll`, 对于 Windows 客户端,安装 TDengine windows 客户端后,如果不能正常 `import taos`,可以将 `C:\TDengine\driver\taos.dll` 拷贝到 `C:\windows\system32` 目录后重新尝试。 对于无法联网用户,可以将 TDengine 客户端中的 `connector/python` 路径(Linux 下其安装路径为 `/usr/local/taos/connector/python/`,Windows 下默认安装路径为 `C:\TDengine\connector\python`)添加到 `PYTHONPATH` 环境变量中使用。 ### 示例程序 示例程序源码位于 `/examples/python`,有: - **read_example.py** Python 示例源程序 用户可以参考`read_example.py`这个程序来设计用户自己的写入、查询程序。 在安装了对应的应用驱动后,通过`import taos`引入 taos 类。主要步骤如下: - 通过 taos.connect 获取 TaosConnection 对象,这个对象可以一个程序只申请一个,在多线程中共享。 - 通过 TaosConnection 对象的 `.cursor()` 方法获取一个新的游标对象,这个游标对象必须保证每个线程独享。 - 通过游标对象的 execute()方法,执行写入或查询的 SQL 语句。 - 如果执行的是写入语句,execute 返回的是成功写入的行数信息 affected rows。 - 如果执行的是查询语句,则 execute 执行成功后,需要通过 fetchall 方法去拉取结果集。 具体方法可以参考示例代码。 ### 安装验证 运行如下指令: ```bash cd {install_directory}/examples/python/PYTHONConnectorChecker/` python3 PythonChecker.py -host ``` 验证通过将打印出成功信息。 ### Python 连接器的使用 #### PEP-249 兼容 API 您可以像其他数据库一样,使用类似 [PEP-249](https://www.python.org/dev/peps/pep-0249/) 数据库 API 规范风格的 API: ```python import taos conn = taos.connect() cursor = conn.cursor() cursor.execute("show databases") results = cursor.fetchall() for row in results: print(row) ``` ##### 代码示例 1. 导入 TDengine 客户端模块 ```python import taos ``` 2. 获取连接并获取游标对象 ```python conn = taos.connect(host="127.0.0.1", user="root", password="taosdata", config="/etc/taos") c1 = conn.cursor() ``` _host_ 是 TDengine 服务端所在 IP, _config_ 为客户端配置文件所在目录。 3. 写入数据 ```python import datetime # 创建数据库 c1.execute('create database db') c1.execute('use db') # 建表 c1.execute('create table tb (ts timestamp, temperature int, humidity float)') # 插入数据 start_time = datetime.datetime(2019, 11, 1) affected_rows = c1.execute('insert into tb values (\'%s\', 0, 0.0)' %start_time) # 批量插入数据 time_interval = datetime.timedelta(seconds=60) sqlcmd = ['insert into tb values'] for irow in range(1,11): start_time += time_interval sqlcmd.append('(\'%s\', %d, %f)' %(start_time, irow, irow*1.2)) affected_rows = c1.execute(' '.join(sqlcmd)) ``` 4. 查询数据 ```python c1.execute('select * from tb') # 拉取查询结果 data = c1.fetchall() # 返回的结果是一个列表,每一行构成列表的一个元素 numOfRows = c1.rowcount numOfCols = len(c1.description) for irow in range(numOfRows): print("Row%d: ts=%s, temperature=%d, humidity=%f" %(irow, data[irow][0], data[irow][1], data[irow][2])) # 直接使用cursor 循环拉取查询结果 c1.execute('select * from tb') for data in c1: print("ts=%s, temperature=%d, humidity=%f" %(data[0], data[1], data[2])) ``` #### Query API 从 v2.1.0 版本开始, 我们提供另外一种方法:`connection.query` 来操作数据库。 ```python import taos conn = taos.connect() conn.execute("create database if not exists pytest") result = conn.query("show databases") num_of_fields = result.field_count for field in result.fields: print(field) for row in result: print(row) conn.execute("drop database pytest") ``` `query` 方法会返回一个 `TaosResult` 对象,并提供了以下属性或方法: 属性: - `fields`: `TaosFields` 集合类,提供返回数据的列信息。 - `field_count`: 返回数据的列数. - `affected_rows`: 插入数据的行数. - `row_count`: 查询数据结果数. - `precision`: 当前数据库的时间精度. 方法: - `fetch_all()`: 类似于 `cursor.fetchall()` 返回同样的集合数据 - `fetch_all_into_dict()`: v2.1.1 新添加的 API,将上面的数据转换成字典类型返回 - `blocks_iter()` `rows_iter()`: 根据底层 API 提供的两种不同迭代器。 - `fetch_rows_a`: 异步 API - `errno`: 错误码 - `errstr`: 错误信息 - `close`: 关闭结果对象,一般不需要直接调用 #### 订阅 API 1. 创建一个同步订阅队列: ```python # 创建一个主题为 'test' 消费周期为1000毫秒的订阅 # 第一个参数为 True 表示重新开始订阅,如为 False 且之前创建过主题为 'test' 的订阅, # 则表示继续消费此订阅的数据,而不是重新开始消费所有数据 sub = conn.subscribe(True, "test", "select * from tb;", 1000) ``` 2. 消费订阅的数据 ```python data = sub.consume() for d in data: print(d) ``` 3. 取消订阅 ```python sub.close() ``` 4. 关闭连接 ```python conn.close() ``` #### JSON 类型 从 `taospy` `v2.2.0` 开始,Python 连接器开始支持 JSON 数据类型的标签(TDengine 版本要求 Beta 版 2.3.5+, 稳定版 2.4.0+)。 创建一个使用 JSON 类型标签的超级表及其子表: ```python # encoding:UTF-8 import taos conn = taos.connect() conn.execute("create database if not exists py_test_json_type") conn.execute("use py_test_json_type") conn.execute("create stable s1 (ts timestamp, v1 int) tags (info json)") conn.execute("create table s1_1 using s1 tags ('{\"k1\": \"v1\"}')") ``` 查询子表标签及表名: ```python tags = conn.query("select info, tbname from s1").fetch_all_into_dict() tags ``` `tags` 内容为: ```python [{'info': '{"k1":"v1"}', 'tbname': 's1_1'}] ``` 获取 JSON 中某值: ```python k1 = conn.query("select info->'k1' as k1 from s1").fetch_all_into_dict() """ >>> k1 [{'k1': '"v1"'}] """ ``` 更多 JSON 类型的操作方式请参考 [JSON 类型使用说明](https://www.taosdata.com/cn/documentation/taos-sql)。 #### 关于纳秒 (nanosecond) 在 Python 连接器中的说明 由于目前 Python 对 nanosecond 支持的不完善(参见链接 1. 2. ),目前的实现方式是在 nanosecond 精度时返回整数,而不是 ms 和 us 返回的 datetime 类型,应用开发者需要自行处理,建议使用 pandas 的 to_datetime()。未来如果 Python 正式完整支持了纳秒,涛思数据可能会修改相关接口。 1. https://stackoverflow.com/questions/10611328/parsing-datetime-strings-containing-nanoseconds 2. https://www.python.org/dev/peps/pep-0564/ #### 帮助信息 用户可通过 python 的帮助信息直接查看模块的使用信息,或者参考 tests/examples/python 中的示例程序。以下为部分常用类和方法: - _TaosConnection_ 类 参考 python 中 help(taos.TaosConnection)。 这个类对应客户端和 TDengine 建立的一个连接。在客户端多线程的场景下,推荐每个线程申请一个独立的连接实例,而不建议多线程共享一个连接。 - _TaosCursor_ 类 参考 python 中 help(taos.TaosCursor)。 这个类对应客户端进行的写入、查询操作。在客户端多线程的场景下,这个游标实例必须保持线程独享,不能跨线程共享使用,否则会导致返回结果出现错误。 - _connect_ 方法 用于生成 taos.TaosConnection 的实例。 ## RESTful Connector 为支持各种不同类型平台的开发,TDengine 提供符合 REST 设计标准的 API,即 RESTful API。为最大程度降低学习成本,不同于其他数据库 RESTful API 的设计方法,TDengine 直接通过 HTTP POST 请求 BODY 中包含的 SQL 语句来操作数据库,仅需要一个 URL。RESTful 连接器的使用参见[视频教程](https://www.taosdata.com/blog/2020/11/11/1965.html)。 注意:与原生连接器的一个区别是,RESTful 接口是无状态的,因此 `USE db_name` 指令没有效果,所有对表名、超级表名的引用都需要指定数据库名前缀。(从 2.2.0.0 版本开始,支持在 RESTful url 中指定 db_name,这时如果 SQL 语句中没有指定数据库名前缀的话,会使用 url 中指定的这个 db_name。从 2.4.0.0 版本开始,RESTful 默认有 taosAdapter 提供,要求必须在 url 中指定 db_name。) ### 安装 RESTful 接口不依赖于任何 TDengine 的库,因此客户端不需要安装任何 TDengine 的库,只要客户端的开发语言支持 HTTP 协议即可。 ### 验证 在已经安装 TDengine 服务器端的情况下,可以按照如下方式进行验证。 下面以 Ubuntu 环境中使用 curl 工具(确认已经安装)来验证 RESTful 接口的正常。 下面示例是列出所有的数据库,请把 h1.taosdata.com 和 6041(缺省值)替换为实际运行的 TDengine 服务 fqdn 和端口号: ```html curl -H 'Authorization: Basic cm9vdDp0YW9zZGF0YQ==' -d 'show databases;' h1.taosdata.com:6041/rest/sql ``` 返回值结果如下表示验证通过: ```json { "status": "succ", "head": [ "name", "created_time", "ntables", "vgroups", "replica", "quorum", "days", "keep1,keep2,keep(D)", "cache(MB)", "blocks", "minrows", "maxrows", "wallevel", "fsync", "comp", "precision", "status" ], "data": [ [ "log", "2020-09-02 17:23:00.039", 4, 1, 1, 1, 10, "30,30,30", 1, 3, 100, 4096, 1, 3000, 2, "us", "ready" ] ], "rows": 1 } ```