admin 发布的文章 - 小飞侠

小飞侠

爱科学-刘磊

admin 发布的文章

pandas中dataframe转为pyspark的dataframe

作者: admin
时间: 2022-01-12
分类: pandas
评论

一、

二、代码

##粗召回数据处理
pandas_df = pd.read_csv("./clothes_women_1356.txt",sep='\t',dtype=str)

schema = StructType([StructField("item_sku_id", StringType(), True)
                   ,StructField("item_first_cate_cd", StringType(), True)
                    ,StructField("item_first_cate_name", StringType(), True)
                    ,StructField("item_second_cate_cd", StringType(), True)
                    ,StructField("item_second_cate_name", StringType(), True)
                    ,StructField("item_third_cate_cd", StringType(), True)
                    ,StructField("item_third_cate_name", StringType(), True)
                     ,StructField("sku_name", StringType(), True)
                   ,StructField("pic", StringType(), True)])

spark_df = spark.createDataFrame(pandas_df, schema=schema)
spark_df.registerTempTable("match_fs")
xtl_df = get_recall_data(dt)
xtl_df = xtl_df.repartition(500)

python虚拟环境调用

作者: admin
时间: 2022-01-07
分类: python
评论

如果虚拟环境已经配置好了tf或者pytorch环境可以直接调用

一、先测试环境是否可用

一般路径：/home/admin/anaconda3/envs/py36_tf2_fj/bin/python
注意测试的时候在bin 目录下不能用 python 需要使用./python

1.tf框架

import tensorflow as tf
tf.test.is_gpu_available()
结果如果为True代表tf环境可用

2.torch框架

import torch
torch.cuda.is_available()

深度学习中的判别模块

作者: admin
时间: 2021-12-06
分类: 基础概念
评论

深度学习的几个步骤
一、特征抽取

二、判别模块
对结果概率的判定：得到logits
具体衡量为：
1.通过linear层:分类
2.通过欧氏距离：是否同品
3.通过余弦距离：是否同品
三、损失函数
四、参数更新
误差方向传播

多模态融合

作者: admin
时间: 2021-11-23
分类: 多模态大模型3
评论

http://blog.17baishi.com/11613/

伯努利分布

作者: admin
时间: 2021-11-10
分类: 概率论
评论

定义：

伯努利分布是假设随机变量x取值要么为0，要么为1，取1发生的概率为p，那么取0的概率是1-p

详细参考：

https://zhuanlan.zhihu.com/p/259571672