helper.py

import os
import json
import html
import requests
import logging

logger = logging.getLogger(__name__)


def modify_dir_name():
    data_dir = 'data'
    dir_list_ = os.listdir(data_dir)
    # print(dir_list_)
    dir_list = []
    for i in dir_list_:
        root_dir = os.path.join(data_dir, i)
        if os.path.isdir(root_dir):
            dir_list.append(root_dir)

    chapter_dir_list = []
    for root_dir in dir_list:
        dir_list_ = os.listdir(root_dir)
        for i in dir_list_:
            root_dir_ = os.path.join(root_dir, i)
            if os.path.isdir(root_dir_):
                # print(root_dir_)
                chapter_dir_list.append(root_dir_)
    dst_dir_list = []
    for chapter_dir in chapter_dir_list:
        exercises_dir = os.listdir(chapter_dir)
        for tem_dir in exercises_dir:
            exercise_path = os.path.join(chapter_dir, tem_dir)
            if os.path.isdir(exercise_path):
                # print(exercise_path)
                dst_dir_list.append(exercise_path)

    for dst_dir in dst_dir_list:
        try:
            dir_name = dst_dir.split('/')[-1]
            root_dir = '/'.join(dst_dir.split('/')[:-1])
            res_dir_name = dir_name.split('　')[1]
            number = dir_name.split('　')[0].split('.')[1] + '.'
            res_dir_name = number + res_dir_name
            print(dst_dir)
            final_name = os.path.join(root_dir, res_dir_name)
            print(final_name)
            os.rename(dst_dir, final_name)
        except:
            print(dst_dir)


def get_files_path(file_dir, filetype='.txt'):
    """得到文件夹下的所有.txt文件的路径
    Args:
        file_dir: 文件夹路径
        filetype: 文件后缀
    Returns:
        所有filetype类型文件的绝对路径
    """
    files_path = []
    for root, dirs, files in os.walk(file_dir):
        for file in files:
            if filetype is None or (os.path.splitext(file)[1] == filetype):
                files_path.append(os.path.join(root, file))
    return files_path


def post(url, params, retry=3, headers=None):
    if headers is None:
        hdrs = {"Content-Type": "application/json"}
    else:
        hdrs = headers
    fails = 0
    while fails < retry:
        try:
            if headers is None:
                data = json.dumps(params)
            else:
                data = params
            logger.debug(f"will post {data} to {url}")
            resp = requests.post(url, data, headers=hdrs, timeout=10)
            if resp:
                logger.info(f"resp {resp.content}")
                return resp.json()
            else:
                logger.error(f"resp: [{resp}]")
                fails += 1
        except Exception as error:
            logger.error(f"post {params} to {url} failed {error}")
            fails += 1
            if fails > retry:
                raise error


def send_topic():
    data_dir = 'data'

    web_url = "https://codechina.csdn.net/csdn/content/book_code_c798a5992a654857867ec15660e1c32a/-/blob/master/"
    request_url = 'http://ccloud.internal.csdn.net/v1/internal/community/content/sendTopic'

    files = get_files_path('data/books/1.Python编程无师自通', '.py')
    mapping_path = 'data/topic_mapping/1.Python编程无师自通.json'

    with open(mapping_path, 'r') as f:
        chapter_code_mapping = json.load(f)

    for file in files:
        topic_title = file.replace('data/books/Python编程无师自通/', '')
        topic_title = topic_title.replace('/', '｜')
        topic_title = topic_title.replace('　', '.')
        # topic_title = html.escape(topic_title)
        topic_content = web_url + file
        topic_content = "代码：<a href=\"{}\">{}</a>".format(
            topic_content, topic_title)

        send_topic_request_param = {
            "type": "long_text",
            "cateId": 20890,
            "content": topic_content,
            "topicTitle": topic_title,
            "mdContent": topic_content,
            "communityId": 3597,
            "loginUserName": "community_286",
            "bizNo": "ebook"
        }

        if chapter_code_mapping.get(file) is None:
            # resp = post(request_url, send_topic_request_param)
            # topic_link = resp['data']['content']['url']
            # chapter_code_mapping[file] = topic_link
            # print('{}:{}'.format(file, topic_link))
            print('错误')
        else:
            send_topic_request_param['id'] = int(
                chapter_code_mapping[file].split('/')[-1])
            resp = post(request_url, send_topic_request_param)
            print('{}:{}'.format(file, chapter_code_mapping.get(file)))

    save_mapping = json.dumps(chapter_code_mapping,
                              ensure_ascii=False,
                              indent=2)
    print(save_mapping)
    with open(mapping_path, 'w') as f:
        f.write(save_mapping)


send_topic()