python教程网

当前位置：首页 » python教程 » 正文

Tensorflow实现部分参数梯度更新操作

看: 957次时间：2020-10-26 分类 : python教程

在深度学习中，迁移学习经常被使用，在大数据集上预训练的模型迁移到特定的任务，往往需要保持模型参数不变，而微调与任务相关的模型层。

本文主要介绍，使用tensorflow部分更新模型参数的方法。

1. 根据Variable scope剔除需要固定参数的变量

def get_variable_via_scope(scope_lst):
  vars = []
  for sc in scope_lst:
    sc_variable = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES,scope=scope)
    vars.extend(sc_variable)
  return vars

trainable_vars = tf.trainable_variables()
no_change_scope = ['your_unchange_scope_name']

no_change_vars = get_variable_via_scope(no_change_scope)

for v in no_change_vars:
  trainable_vars.remove(v)

grads, _ = tf.gradients(loss, trainable_vars)

optimizer = tf.train.AdamOptimizer(lr)

train_op = optimizer.apply_gradient(zip(grads, trainable_vars), global_step=global_step)

2. 使用tf.stop_gradient()函数

在建立Graph过程中使用该函数，非常简洁地避免了使用scope获取参数

3. 一个矩阵中部分行或列参数更新

如果一个矩阵，只有部分行或列需要更新参数，其它保持不变，该场景很常见，例如word embedding中，一些预定义的领域相关词保持不变（使用领域相关word embedding初始化），而另一些通用词变化。

import tensorflow as tf
import numpy as np

def entry_stop_gradients(target, mask):
  mask_h = tf.abs(mask-1)
  return tf.stop_gradient(mask_h * target) + mask * target

mask = np.array([1., 0, 1, 1, 0, 0, 1, 1, 0, 1])
mask_h = np.abs(mask-1)

emb = tf.constant(np.ones([10, 5]))

matrix = entry_stop_gradients(emb, tf.expand_dims(mask,1))

parm = np.random.randn(5, 1)
t_parm = tf.constant(parm)

loss = tf.reduce_sum(tf.matmul(matrix, t_parm))
grad1 = tf.gradients(loss, emb)
grad2 = tf.gradients(loss, matrix)
print matrix
with tf.Session() as sess:
  print sess.run(loss)
  print sess.run([grad1, grad2])

以上这篇Tensorflow实现部分参数梯度更新操作就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持python博客。

标签：numpy

2021-12-20Python 实现图片色彩转换案例
2021-12-20python初学定义函数
2021-12-20图文详解Python如何导入自己编写的py文件
2021-12-20python二分法查找实例代码
2021-12-20Pyinstaller打包工具的使用以及避坑
2021-12-20Facebook开源一站式服务python时序利器Kats详解
2021-12-20pyCaret效率倍增开源低代码的python机器学习工具
2021-12-20python机器学习使数据更鲜活的可视化工具Pandas_Alive
2021-12-20python读写文件with open的介绍
2021-12-20Python生成任意波形并存为txt的实现

搜索

推荐资源

python教程网

当前位置：首页 » python教程 » 正文

Tensorflow实现部分参数梯度更新操作

看: 957次 时间：2020-10-26 分类 : python教程

相关文章

搜索

推荐资源

看: 957次时间：2020-10-26 分类 : python教程