本文不同于官网的HelloWorld式入门,它没考虑账号安全和数据量等实际应用情况
本文经验并不全面,因为一般会使用StorageExplorer和AzCopyV10,Python只是用于做下脚本操作;
搭建
- 默认已安装好Python,已拥有Azure存储账号;
- 安装依赖项( Git SDK地址):
pip install azure-storage-blob
创建
不应该
block_blob_service = BlockBlobService(account_name = 'accountname', account_key = 'accountkey')
而应该
block_blob_service = BlockBlobService(account_name = 'accountname', sas_token= '连接字符串')
使用经验:代码应尽可能不放置密钥,而是使用账号+SAS(shared access signature)的方式;官方文档的SDK说明都是使用账号+密钥的连接字符串方式,其实听危险的。应该为不同的容器获取不同的SAS,设置合理的过期时间和操作权限,做好管理工作;
遍历(list)
#可以视为“目录路径”,一般不会要列出一整个container的文件
path_preffix = "blob_path1/blob_path2"
marker = None
while True:
generator = block_blob_service.list_blob_names(container_name, path_preffix, num_results=100, marker=marker)
#返回的是一个生成器
for blob_name in generator:
print(blob_name)
marker=generator.next_marker
if not marker:
break
- list_blob_names和list_blobs主要参数相同,只是返回不同,如果只是遍历操作,自然是选择IO和耗时更小的list_blob_names
- path_preffix是路径前缀,因为不是文件系统,目录都是假的;实际影响是:1)不可能创建一个空目录,上传空目录也是非法的;2)list返回的只有blob文件,带有路径前缀的文件,不像Linux有目录文件;
- num_results 返回结果数,类似分页,数据量大时需要分页获取,配合next_marker 可以获取全部结果
上传
block_blob_service.create_blob_from_path(container_name, local_file_name, full_path_to_file)
下载
block_blob_service.get_blob_to_path(container_name, local_file_name, full_path_to_file)
没有实际使用,所以不详述了;有需要可以了解下AzCopy的sync命令
读取文件
content = block_blob_service.get_blob_to_text(container_name, blob_name).content
- get_blob_to_text其实也是下载的一种,同类操作有:get_blob_to_path(下载为文件),get_blob_to_byte(二进制),get_blob_to_stream(读取为流);上传create_blob_也有这四种方式;
- blob_name是完整路径加文件名,只适合读取小文本文件;
复制
这里我希望做个操作:将一个blob文件重命名复制到另一个位置,不用下载本地修改后再上传;
copy_opt = block_blob_service.copy_blob(container_name, "target_blod_name", "source_file_url")
- target_blod_name是要复制到的文件路径
source_file_url是复制的Azure存储源文件的地址,https格式的url;此处需要加SAS,使用带连接字符串的URL,因为上方我是使用账号+SAS的方式连接,无法自动判断是同一个账号下的资源。哪怕加了连接字符串,但实际也是云内的操作,速度有保证 - copy_blob会返回一个操作对象,可以查看状态;操作默认是异步的,可以通过requires_sync参数改为同步;
删除
#你真的需要删除吗?
如果对你有帮助,希望能点个关注,或者点个喜欢