NLP实战高手课学习心得
NLP实战高手课学习心得,更多完整内容,一起来学习
NLP实战高手课学习心得,更多完整内容,一起来学习
NLP实战高手课学习心得
A2C和A3C:如何提升基本的PolicyGradient算法
AlphaStar介绍:AlphaStar中采取了哪些技术?
ASDL和AST
AutoML及NeuralArchitectureSearch简介
AutoML网络架构举例
COMAAgent之间的交流
DeepGBM:如何用神经网络捕捉集成树模型的知识
DifferentiableSearch:如何将NAS变为可微的问题
DirectPolictyGradient:基本设定及Gumbel-trick的使用116丨DirectPolictyGradient:轨迹生成方法
Docker部署实践
Docker简介
Gumbel-trick:如何将离散的优化改变为连续的优化问题?
ImitationLearning和Self-imitationLearning
IMPALA:多Agent的Actor-Critic算法
InductiveLogicProgramming:基本设定
InductiveLogicProgramming:一个可微的实现
Istio简介:Istio包含哪些功能?
Istio实例和Circuit Breaker
Kubernetes Ingress
Kubernetes Stateful Sets
Kubernetes部署实践
Kubernetes服务发现
Kubernetes灰度上线
Kubernetes基本概念
Kubernetes健康检查
Kubernetes自动扩容
LambdaCaculus概述
Lambda-DCS概述
Learning to optimize:是否可以让机器学到一个新的优化器
LeNAS:如何搜索搜索space
MCTS简介:如何将“推理”引入到强化学习框架中
Model-basedReinforcementLearning
PolicyGradient:如何进行PolicyGradient的基本推导?
PPO算法
Q-learning:如何进行Q-learning算法的推导?
Quora问题等价性案例学习:深度学习模型
Quora问题等价性案例学习:预处理和人工特征
Rainbow:如何改进Q-learning算法?
RENAS:如何使用遗传算法和增强学习探索网络架构
Reward设计的一般原则
RL训练方法RL实验的注意事项
RL训练方法集锦:简介
TransferReinforcementLearning和Few-shotReinforcementLearning
Tranx简介
WikiSQL任务简介
层次搜索法:如何在模块之间进行搜索?
超参数搜索:如何寻找算法的超参数
多代理增强学习概述:什么是多代理增强学习?
多模态表示学习简介
解决SparseReward的一些方法
使用增强学习改进组合优化的算法
微服务和Kubernetes简介
文本推荐系统和增强学习
文本校对案例学习
遗传算法和增强学习的结合
增强学习的基本设定:增强学习与传统的预测性建模有什么区别?
增强学习中的探索问题
知识蒸馏:如何加速神经网络推理
最短路问题和DijkstraAlgorithm